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数字 图 像 处 理 


。 诛 程 介绍 
~ 教材 及 参考 书 
~ 上 课 主要 内 容 
~ 谍 程 目的 与 要 求 
v 考试 内 容 
~ 助教 老师 
” 国内 外 相关 会 议和 杂志 
“ 目前 需要 做 的 事情 










































































教材 及 参考 书 




































































。 教 材 


Rafael CC，Gonzalez，Richard ENWoods 
著 ， 阮 秋 琦 、 阮 宇智 等 译 ， 数 字 图 像 处理 〈 第 
二 版 ) ， 电 子 工业 出 版 社 ，2003 年 。 





了 Rafael 5C，Gonzalez，Richard E，Woods， 
Digital Image Processing(Second 
Edition) ，Prentice Hal1，2003。 











教材 及 参考 书 《〈 续 ) 

































































Kenneth R，Castleman 和 车 ， 朱 志 了 刚 、 林 学 疝 、 石 定 
机 等 译 ， 数 字 图 像 处 理 ， 电 子 工 业 出 版 社 ，2002 年 。 


~ 草 租 晋 ， 图 象 工程 上 册 一 图 象 处 理 和 分 析 ， 清 华 大 
学 出 版 社 ，2003 年 。 


ee 


~ 杨 术 灵 、 王 开 等 ，Visual C++ 数字 图 像 获 取 、 处 理 
及 实践 应 用 ， 人 民 邮 电 出 版 社 ，2003 年 。 


“ 章 毓 晋 ， 基 于 内 容 的 视觉 信息 检索 ， 科 学 出 版 性 ， 
2003 年 。 











上 谍 主 要 和 内容 

































































2 衬 间 域 图 像 增强 

3. 彩色 图 像 处 理 

4 基于 内 容 的 图 像 检 索 〈 补 序 ) 
5 傅 里 叶 变 换 

6. 频率 域 图 像 增强 

7. 图 像 复原 

8 图 像 压 缩 〈1) 





上 谍 主 要 内 容 〈 续 ) 


9 图 像 压 缁 〈2) 

10， 形态 学 图 像 处 理 

11， 图 像 分 割 

12， 表示 与 的 述 

13， 基于 内 容 的 视频 分 析 和 检索 技术 〈 补 充 ) 
14， 考试 复习 










































































诛 程 目的 与 要 求 


ee 


e。 初步 运用 所 学 知识 解决 实际 问题 
e。 为 图 像 处 理 及 相关 领域 的 研究 打下 基础 
”图 像 处 理 
”计算 机 视觉 
”基于 内 容 的 图 像 、 视 频 检索 
人 脸 识 别 、 指 纹 识 别 、 擎 纹 识 别 、 虹 腊 识 别 
“图像 分 类 、 图 像 和 视频 的 语义 概念 检测 、.……. 












































































































































e。 平时 作业 50%， 考 试 成 绩 50% 
e 平时 作业 选择 下 列 两 个 之 一 : 
> 分 组 完成 一 个 大 作业 


> 其 他 与 图 像 处 理 相关 的 课题 (需要 上 谍 老 师 
认可 ) 


。 考试 周知 完成 〈 基 本 概念 、 原 理 和 算法 ) 










































































































































































































































































































































































































































































助教 老师 


且 
@ 曹 短 


FE mall: caolelQlcst. pku. edu. cn 
电话 : 825293814 


注意 : 有 不 全 的 地 方 多 问 助 教 才 师 ， 充 分 友 挥 助教 老师 的 
指导 作用 

































































































































































































































































































































































































































































国内 外 相关 会 议和 杂记 


。 国内 杂志 : 一 级 学 报 


W 


Journal of Computer Sclence and 
Technology (JCST) (SCTL) 


计算 机 学 报 
软件 学 报 
电子 学 报 
计算 机 研究 与 发 展 




































































































































































































































































































































































































































































国内 外 相关 会 议和 杂志 〈 续 ) 





@ 国外 会 议 : 


W 


IEEE Intetfrnational Conference on Computer 
Vision (ICCV) 


IEEE Intetfrnational Conference on Computer 
Vision and Pattern Recognition (CVPR) 


ACM Multimedia Conference (MM) 




































































































































































































































































































































































































































































国内 外 相关 会 议和 杂志 〈 续 ) 
@ 国外 会 议 : 


~ TIEEE International Conference on [Image 


Processing (ICIP) 


TIEFEE Interfrnational Conference on MulLtimedia 
and Expo (ICME) 


nterfrnational Conference on Pattefn 
Recognition (ICPR) 


~ ， ACM International Conference on Image and 
Video Retfrieval (CIVR) 

































































































































































































































































































































































































































































国内 外 相关 会 议和 杂志 《〈 续 ) 


队 





明 刊 : 


IEEE Transactions on Pattern Analyslis and 
Machine Intelligence (PAMI) 


TIEEE Transactions on Image Processing (IP) 


IEEE Transactions on Cifrcults and Systems for 
Video Technology (CSVT) 


Intefrnational Journal of Computer Vision 
(IJCV) 


Pattern Recognition (PR) 
Image and Vision Computing (IVOC) 




































































































































































































































































































































































































































































目前 需要 做 的 事情 
。 选读 学 生发 送 下 列 信息 给 老师 : 


pengyuxlno@licst. pku. edu. cn 
“ 姓名 

7 学 号 

v 联系 方式 : E_ mail, 电话 

“ 硕士 生 或 博士 生 ， 年 级 

“ 所 在 院 系 、 实 验 室 、 导 师 

“ 研究 方 问 




































































































































































































































































































































































































































































数字 图 像 处 理 基础 


概念 : 图 像 、 数 字 图 像 、 像 素 
“ 数字 图 像 处 理 的 起 源 
数字 图 像 处 理 的 应 用 领域 
“ 图 像 处 理 系统 的 部 件 
。 基础 知识 
“ 图 像 的 采样 和 量化 
“ 数字 图 像 的 表示 
~ 数字 图 像 的 质量 
~ 像素 间 的 一 些 基 本 关系 





































































































































































































































































































































































































































































什么 是 图 像 ? Co 


“定义 为 二 维 疼 数 fx, 7) , 其 中 ，X, 7 是 空间 坐标 ，f (x, y) 
是 点 〈x, y) 的 幅 值 
“ 灰 度 图 像 是 一 个 二 维 灰 度 〈 或 亮度 ) 函数 fx, y) 


v 彩 色 图 像 由 三 个 〈 如 RGB, HSV) 二 维 灰 度 〈 或 亮度 ) 函数 
f(xX，y) 组 成 









什么 是 数字 图 像 ? 

































































“ 像素 组 成 的 二 维 排列 ， 可 以 用 天 阵 表示 





对 于 单 色 〈 灰 度 ) 图 像 而 言 ， 每 个 像素 的 亮度 用 一 个 数 
值 来 表示 ， 通 常数 值 范 围 在 0 到 255 之 间 ，0 表 示 黑 、255 表 
示 白 ， 其 它 值 表示 处 于 黑白 之 间 的 灰 度 


彩色 图 像 可 以 用 红 、 绿 、 蓝 三 元 组 的 二 维和 矩阵 来 表示 。 
通 和 ， 三 元 组 的 每 个 数值 也 是 在 0 到 255 之 间 ，0 表 示 相 应 
的 基色 在 该 像素 中 没有 ， 而 255 则 代表 相应 的 基色 在 该 像 
素 中 取得 最 大 值 





数字 图 像 的 像素 表示 







































































数字 图 像 由 二 维 的 元 素 组 成 ， 每 一 个 元 素 具 有 一 个 
特定 的 位 置 (x, y) 和 幅 值 f(x, y), 这 些 元 素 就 称 为 像素 








数字 图 像 处 理 的 起 源 

































































图 像 在 传输 过 程 后 的 更 好 复原 
~ 空间 应 用 : 图 像 增 强 、 图 像 复 原 
“ 医学 图 像 .……. 
~ 作用 : 通过 图 像 增 强 、 图 像 复原 等 技术 ， 增 强 或 复 
原 模 糊 或 损毁 的 图 像 
e 机 器 感知 
~ 自动 字符 识别 OCR 
~ 人 脸 识别 
~ 指纹 识别 ， 生 物 特征 识别 ..…. 










































































e。 最 新 领域 
~ 数码 相机 (DC) 、 数 码 摄 像 机 (DV) 
~ 指纹 识别 、 人 脸 识别 
v 互联 网 、 视 频 、 多 媒体 等 
~ 基于 内 容 的 图 像 检 索 、 视 频 检 索 、 多 媒体 检索 
~ 水印、 游戏、 电影 特技 、 虚 拟 现实 、 电 子 商务 等 


数字 图 像 处 理 的 应 用 无 处 不 在 








ss 


衡 
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例 1: 图 像 增强 一 一 直方 图 




































































例 2， 人 脸 检 测 与 识别 








了 


镜头 边界 检测 


例 3 









































































































































例 4: 基于 内 容 的 图 像 检 索 
例 5: 基于 扩容 的 侍 头 检索 








- 方正 天 资 坦 体 资产 管 理 系 统 





视频 检 未 操作 Ko) 查看 (四 ” 帮 助 (H) 
口 鹃 


方才 2 
习 
Static 


022430. bmp 


D26494. bmp 


023985. bmp 
入 


D19686. bmp 


D15851. bmp 


Dz22542. bmp 


D26305. bmp 

D23047. bmp 

015871 bmp 
仿 


034182. bmp 


要 一 
D19901. bmp 


站 2 np 


023838. bmp 


0D23766. bmp 


025973. 
022663. bmp 
024384. 到 
025337， 
-一 


D23690. bmp 


0D26255. bmp 


0D25070. bmp 
2 


D26098. bmp 
- 二 
0D34397. bmp 


D22756. bmp 


D26698. bmp 


0D23172. bmp 


D22T04. bmp 


D34402. bmp 


0D22825. bmp 


Dz4078. bmp 


D24561. bmp 


D15837. bmp 


0D34936. bmp 


D30633. bmp 


D22930. bmp 


Dz25458. bmp 
国 


D31076. bmp 


Dz26201 . mm 


D26395. bmp 


D22965. bmp 


022930. bep 

， 
016580. bmp 
DEL 
Er 


D16079. bmp 





D25861. bm 
D22965. bm 


D20440. bm 


D22588. bm 了 | 
上 





































































































































































































































































































































































































































































例 6: 基于 内 容 的 视 吕 频 片断 检索 


吕方 正 天 资 并 体 资产 管理 系统 


相 亿 性 检索 “精确 检索 ”和 助 
na9npd-hmn nr9n79. hmn _n5g9n99- hmn 05910 和 hnmn_n59124.hmn np917F.hmn nng9231.hmn nr928F-hmn _n59333. 








059064.bmp 059079. bmp 059175. bmp 059231.bmp 059285.bmp 059333. bn 










090773.bmp 090793. bmp 090816. bmp 的 bmp 090876. bmp 090906. bmp 090918. bmp 090927. bmp 090966. bn 





226667.bmp 226683. bmp 





137049. bmp 137151.bmp 137163. bmp 137229. bmp 





137098. bmp 雹 flL69.bmp， 二 37T221 bmp 137247.bmp 137267. bn 

































































































































































































































































































































































































































































_Dpsnrils | 
GetImage | 


字 戎 区域 提 了 模块 





是 过 


载 到 个 晶 在 这 儿 闲 着呢 


< 


顽 于 
我 1 这 叶 用 省 喧 







































































































































































































































































































































































































































































例 7， 视 频 字 幕 识别 


上 LEUJUIET 
控制 


人 et 工 m 区 e 一 了 xit | 


一 字 兰 区域 提取 模块 
绽 1 























D0003944 








广 背 且 去 唆 模 块 
fe 1 


表 























例 8，101 个 视频 概念 的 检测 
直 有 臣 标 


Anchor Y。Arafat Baseball “Basketba 目 Beach Bic ycle Bird 


加 证 ] 国 局 4 一 2 交 | ES 及 


Bus G.Bush jr，G- Bush sr-。 Candle Chair Charts TS Clinton loud ”Corp-Leader 


本 于 到 让 二 Uon ntertalinment 丘 字 
Cartoon anchor 




















2 weapon Fish 攻 Flag USA 医治 Footba 罩 rr 这 GoYempment 本 Grass Horse 


ldin 隐 : 习 
Horse racing House He。 Jintao J。 [ 汉 Lahoud 出 ale 中 Mee 民 习 区 y Monologdue Motorbike 


Mountain H.Nasrallah Natural Night fire Dffice Dutdoor DODverlayed People People Police/ 








disaster text marching va security 


C. Powell “Prisoner Racing 和 River Screen ASharon Smoke 


2 二 国电 * 二 国 国 


Studio Swimming Table Tan Tennis Tower FUckK Urban Vegetation 
Qi 


4 


Violence Waterfall Waterscape Weather 































































































例 8:， 101 个 视频 概念 的 检测 







































































































































































































































































































































































视频 语义 标注 的 基本 方法 


























































































































































































































































































































































































































































































图 像 处 理 系 


JInterhnet 

































































































































































































































































































































































































































































图 像 处 理 系统 的 基本 组 成 结构 


e。 主要 由 三 大 部 分 组 成 


图 像 数 字 化 设备 ， 包 括 数码 相机 、 数 
es 市 照相 和 /或 摄像 功能 的 手机 





四 图 像 处 理 设 备 ， 包 括 计算 机 和 存储 系 


~ 图 像 输 出 设备 ， 包 括 打 印 机 ， 也 可 以 
输出 到 Internet 上 的 其 它 设备 

































































































































































































































































































































































































































































图 像 存储 系统 


冬 像 文件 格 却 体系 

互联 网 用 : GIF、JPG 
印 刷 用 : TIF、JPG、TAG 、PCxX 
国际 标准 : TIF、JPG、BMP 

图 像 存储 体系 : 分 级 存储 
内 存 存储 : 处 理 时 使 用 
便 盘 存储 : 处 理 、 备 份 时 用 《在 线 ) 
备份 存储 : 光 委 、 人 厂 带 《离线 、 近 线 ) 
网 络 人 存储: SAN、 NAS 











为 什么 要 用 SAN 

































































存储 区 二 网 SAN (Stofrage Area Network) 













SAN 征 什么 ? 

































































《Client 1 SETVET 


回 吊 SErver 


Switc | se 一 一 天 “Disk array 
国 Er 


次 生生 th 
Disk array Disk array Switch SS Tape Libarary 


Disk array Disk array Disk array Tape mm 





















SAN 是 什么 ? 〔 续 ) 






























































e 个 是 client/server, 而 是 client/storage devices 

。 独立 于 LAN 之 外 的 融 速 存储 网 络 

e 一 般 采 用 避 速 的 光纤 通道 作为 传输 媒体 〈2Gbitys ) 

e 将 存储 设备 通过 光 通 道 互 连 设 备 构成 一 个 存储 子 网 

e 文 持 服务 茵 和 存储 设备 乙 间 任意 到 任意 的 连接 

e SAN 上 的 任何 一 全 服务 器 均 可 存 取 网 络 中 的 任何 一 个 存 
储 议 备 

e 对 网 上 的 存储 资源 实施 集中 统一 的 管理 













































































是 优化 的 文件 服务 器 ， 存 储 设备 与 服务 器 均 直 接连 
接 到 LAN 上 ， 使 用 TCP/IP 等 LAN 协 议 ， 通 过 LAN 实 现 数据 交 
换 和 存储 管理 。 由 于 使 用 网 络 协 议 ， 因 而 会 有 速度 和 延 
时 的 问题 ， 且 系统 扩展 能 力 受 到 网 络 融 宽 的 限制 。 








SAN 与 NAS 比 较 EN 

































































网 络 协议 (如 TCPVIP) 


更 遍 的 连接 速度 和 处 理 能 力 | 较 低 的 连接 速度 和 处 理 能 








数字 图 像 处 理 基础 


。 图 像 的 采样 和 量化 

。 数 子 图 像 的 表示 

。 数 子 图像 的 质量 

。 像素 间 的 一 些 基本 关系 


邻 域 处 理 方法 是 图 像 增 强 和 复原 过 程 
的 核心 













































































图 像 的 采样 和 量化 


e。 大 多 数 传 感 厚 的 输出 是 连续 电压 波形 


。 为 了 产生 一 幅 数 字 狗 像 ， 需 要 把 连续 的 
感知 数据 转化 为 效 字 形 却 


e。 这 包括 两 种 处 理 : 取样 和 量化 
e。 取 任 : 图 像 空 间 坐标 的 数字 化 
e 量化 : 图 像 函 数 信 《 灰 度 住 ) 的 数字 化 












































































































































e 宇 间 坐标 必 , 7 的 数字 化 被 称 为 图 像 来 样 
e。 确定 水 平和 垂 理 方向 上 的 像素 个 数 N、M 







































































































































































































































































































































































































































































图 像 的 量化 


e 国 数 取 值 的 数字 化 被 称 为 图 像 的 量化 ， 如 
量化 到 256 个 灰 度 级 


f 




































































































































































































































































































































































































































































图 像 的 采 桩 与 数字 图 像 的 质量 





1024 


FIGURE 2.19 A 1024 x 1024.8-bit Imaspge Subsampled down to Size 32 X 32 Pixels. The number of allowable 
gray levels was kept at 236. 


图 像 的 采 桩 与 数字 图 像 的 质量 


1024 久 1024 有 256 久 256 








本 中 图 128 勾 128 64 勾 64 6 又 叹 


FIGURE 2.20 (al) 1024 xx 1024.8-bit imasge.(b)S12 xx S$12 1masge resampled into 1024 X 1024 pixels by row and 


column duplication. (c) throush (站 256 xx 256. 128 x 128. 64 x 64. and 32 X 32 imases resampled into 
1024 X 1024 pixels. 





133x90 





二 
芋 


字 图 像 的 


与 数 


图 像 的 量化 






































































































































































































































































































































































































































































































































































































































































































































































































































































































































图 像 的 采样 和 量化 


e 非 统一 的 图 像 的 采样 
v 在 灰 度 级 变化 尖锐 的 区 域 ， 用 细腻 的 采样 ， 
在 灰 度 级 比较 平滑 的 区 域 ， 用 粗糙 的 采样 








了 覃 HT 上 
国 国 国 面 面 酉 别 严 
| | ee 




































































































































































































































































































































































































































































图 像 的 采样 和 量化 


e。 非 统一 的 网 像 的 量化 
“在 边界 附近 使 用 较 少 的 灰 度 级 。 剩 余 的 
灰 度 级 可 用 于 灰 度 级 变化 比较 平 请 的 区 
坟 
“ 避 狗 或 减少 由 于 量化 的 太 粗 糙 ， 在 灰 度 
级 变化 比较 平 请 的 区 城 出 现 假 轮 廓 的 现 
象 

































































































































































































































































































































































































































































数字 图 像 处 理 基础 





。 图 像 的 采样 和 量化 

。 数 于 图像 的 表示 

。 数字 图 像 的 质量 

。 像素 间 的 一 些 基本 关系 





e 二 维 离散 壳 度 图 数 一 一 f (xy) 
 x，y 说 明 网 像 像 系 的 空间 坐标 
函数 值 f 代表 了 在 点 (x, y) 处 像素 的 灰 度 
值 

e 二 维 窃 阵 一 一 Alm, nj 

v mm ，n 说 明 疼 像 的 宽 和 高 。 

证 阵 元 系 ati，j) 的 但 ， 表 示 图 像 在 第 1i 


行 ， 第 j 列 的 像 孙 的 灰 度 值 ; ij 表示 儿 何 
位 置 
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e 疼 像 折 述 信息 


“如 图 像 高 度 和 宽度 等 
百 忆 、 







































































head 

e 疼 像 数据 

~ 央 序 存放 的 连续 数据 
e BMP 格式 

1 位 图 文件 头 Data 

2 位 图 信息 头 

3 调 色 板 

4 图像 数据 










































































BMP 格式 


1、 位 图 文件 头 








typedef strfruct tagBITMAPFILEHEADER 1 


WORD ”bfType， 
DWORD “bfSilze:; 


WORD ”bfReserved1l : 
WORD ”bfReserved2 : 


DWORD bfoffBits ; 
上 BITMAPFILEHEADER ; 


// 文 件 类 型 ， 必 须 是 字符 串 ”BM 

刀 和 是 广 人 SS 

// 保 留 和 学 ， 不 考 展 

// 保 留 字 ， 不 考 展 

// 从 文件 头 到 位 铬 数据 的 俩 移 字 下 效 








BMP 格式 






























































2、 位 图 信息 头 








DWORD biSize:; 

LONG “biWwidth， 

LONG “biHeight: 

WORD “biPlanes:; 

WORD ”biBitCount 
DWORD biCompfression，; 
DWORD biSizeImage; 


DWORD biClFrUsed; 
DWORD biClrImportant : 
} BITMAPINFOHEADER ; 





LONG “bixPelsPerMeter: 
LONG “biyYPelsPerMeter: 


typedef sttfuct tagBITMAPINFOHEADER { 


// 该 结构 的 长 度 ，40 个 字 节 
// 图 像 的 宽度 ， 单 位 是 像素 
// 图 像 的 高 度 ， 单 位 是 像素 
// 必 须 是 1 

// 颜 色 位 数 ， 如 1，4，8，24 
// 压 缩 类 型 ， 如 BI_RGB, BI_RLE4 
// 实 际 位 图 数据 占用 的 字 节 数 
// 水 平分 辨认 

// 垂 直 分 辩 率 

// 实 际 使 用 的 颜色 数 

// 重 要 的 颜色 数 
















































































typedef sttfruct tagRGBQUAD { 


BYTE “rgbBlue， // 该 烦 色 的 赣 色 分 量 
BYTE ”TYgbGreen // 该 类 色 的 绿色 分 量 
BYTE ”YegbRed: // 该 颜色 的 红色 分 量 
BYTE ”rgbReserved: // 保 留 值 ， 不 考虑 

} RGBQUAD， 


注 : 有 些 位 图 不 需要 调 色 板 ， 如 真 彩色 图 ， 
它们 的 BITMAPINFOHEADER 后 面 下 接 是 位 独 效 扼 







































































。 对 于 2 色 位 图 ，1 位 表示 一 个 像素 颜色 ， 
所 以 一 个 字 节 表示 8 个 像素 


e 对 于 16 色 位 图 ，4 位 表示 一 个 像素 颜色 ， 
所 以 一 个 字 节 表示 2 个 像素 


。 对 于 256 色 位 图 ，1 个 学 节 表 示 1 个 像素 
。 对 于 真 彩色 图 ，3 个 字 节 表示 一 个 像素 








数字 图 像 处 理 基础 


。 图 像 的 采样 和 量化 

。 数 子 图像 的 表示 

。 数 了 图 像 的 质量 

。 像素 间 的 一 些 基 本 关系 













































































图 像 的 质量 : 1、 层 次 


。 灰 度 级 ;表示 像素 明暗 程度 的 整数 量 
例如 ， 像 素 的 取 值 范围 为 0-255， 就 称 访 
图 像 为 256 个 灰 度 级 的 图 像 

。 层 。 次 : 表示 图 像 实 际 拥有 的 灰 度 级 的 
数量 
例如 ， 具 有 32 种 不 同 取 值 的 图 像 ， 可 称 
该 图 像 具 有 32 个 层次 

图 像 数据 的 实际 层次 越 多 ， 视 觉 效 果 就 越 好 









































































































































































































































































































































































































































































































































图 像 的 质量 1、 层次 


256 个 层次 的 镜像 


64 个 层次 的 疼 像 


16 个 层次 的 疼 像 







































































































































































































































































































































































































































































e 对 比 度 : 是 指 一 幅 图 像 中 灰 度 反 关 的 大 小 
对 比 上 度 = 最 大 腕 度 / 最 小 壳 虔 







































































































































































































































































































































































































































































图 像 的 质量 : 3、 清 晰 度 


e 与 清晰 上 度 相关 的 主要 因 了 又 
v 宫 上 度 
v 对 比 度 
v 斥 寸 大 小 
“细微 层次 
颜色 饱和 度 






































































































































































































































































































































































































































































































































































































































































































































































































































































































































影 啊 清晰 度 因 素 一 2、 对 比 度 


降低 对 比 度 










































































































































































































































































































































































































































































影响 清晰 度 因 素 一 3、 尺寸 大 小 


忌 久 近 小 矿 寸 




































































































































































































































































































































































































































































影 啊 清晰 度 因素 一 4、 细微 层 次 








忌 图 减少 细 化 层次 




































































































































































































































































































































































































































































影 啊 清晰 度 因 素 一 5、 颜色 饱和 度 











数字 图 像 处 理 基础 


。 图 像 的 采样 和 量化 

。 数 子 图 像 的 表示 

。 数字 图 像 的 质量 

e。 像素 间 的 一 些 基本 关系 










































































像素 间 的 一 些 基本 关系 







































































wv 4 邻 域 
~ D 邻 域 


v 4 连通 
~ 8 连通 
连通 








相 邻 像素 一 4 邻 域 


e 4 信 域 : 像 辫 pbp (x y) 的 4 信 二 是 : 
(x+l, y) ; (xl y) (xy+l) ， (X， y 一 1) 







































































e。 用 Ni(p) 表示 像 系 p 的 4 邻 工 


(X，y+]) 


(X-1，y) (X+1，y) 





(X，y 一 |) 








相 邻 像素 一 0D 邻 域 


eD 邻 域 定 义 : 像 系 p4x y) 的 D 邻 域 旦 : 


对 角 上 的 点 (xtl, y+l) (x+rl y-IL) (x- 
1,，y+1) ; (X-1，y 一 ]) 


se 用 Nh(p) 表示 像 系 p 的 D 邻 城 







































































(xy+1) (x+1,，y+1) 


(x-1, y-J) (X+1，y 一 |) 








相 邻 像素 一 8 邻 域 


e 8 邻 域 定 义 : 像素 px y) 的 8 邻 域 是 : 
4 邻 域 的 点 十 D 邻 域 的 点 

e 用 Ns(p) 表示 像素 p 的 8 邻 堪 。 
Nes(p) = NOp) + NTD(D) 
















































































像素 间 的 连通 性 人 


e 连通 性 下 持 述 区 域 和 边界 的 重要 概 




































































TZ 


e 两 个 像 又 连通 的 两 个 必要 条 件 是 : 
两 个 像素 的 位 置 是 否 相 邻 
两 个 像素 的 灰 度 值 是 否 满足 特定 的 相 

似 性 准则 《或 者 是 否 相 等 ) 
e 4 连通 、8 连 通 、m 连 通 的 定义 








像素 的 连通 性 一 一 4 连通 


e 对 于 具有 值 y 的 像 条 p 和 qdq， 如 果 q 在 
集合 N (p) 中 ， 则 称 这 两 个 像素 是 4 
连通 的 













































































像素 的 连通 性 一 一 8 连通 


e 对 于 具有 值 y 的 像素 p 和 q， ER 集 
合 N。(p) 中 ， 则 称 这 两 个 像素 是 8 连 
的 






































































































































































































































































































































































































































































































































像素 的 连通 性 一 一 m 连 通 





对 于 具有 值 V 的 像 系 p 和 q， 如 末 : 
Id 在 集合 N, bp) 中， 或 
II.， qd 在 集合 Ni p) 中， 并 且 N, (p) 与 N (qd) 
的 交集 为 空 〈 没 有 值 V 的 像 妹 ) 
则 称 这 两 个 像 北 是 m 连 通 的 ， 即 4 连通 和 D 
连通 的 混合 连通 。 





由 
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UN 
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像素 的 连通 性 一 一 通路 


e 通路 的 定义 

一 条 从 具有 坐标 4x, y) 的 像素 pb, 到 具有 坐标 \s, t) 
的 像 北 dq 的 通路 ， 是 具有 坐标 

(Xu， 克 乓 志 滞 / ，.。。. ， 6 人 y ) 的 不 同 像素 的 厅 
列 。 其 中 ，(xo yo = (xy)，Cy) = 《st)， 
(Xij， yi 和 0 yi ) 是 邻接 的 ， 1] 迄 1 工 和 nn 
是 路 径 的 长 度 。 如 果 (xw yo = (xy) ， 则 充 通 
路 十 闭合 通路 




































































































































































































































































































































































































































































像素 的 连通 性 一 一 距离 


像素 之 间距 离 的 定义 

。 欧 氏 距离 定义 

。 D ,距离 〈 城 市 距离 ) 定义 
。 D, 距 离 〈 棋 盘 距离 ) 定义 




















































































































































































































































































































像素 之 间距 离 的 定义 


对 于 像素 p、d 和 z， 分 别 具 有 坐标 (x, y) ， 
(st) 和 (uv) ， 如 果 


四 DGp,dq) 过 0 (DGp,q)=0， 当 且 仅 
当 p =d)， 

2) DGp,q) = D(q,p) 

G3) DGp,zZ) 委 D(p,q) + DCq，Z) 

























































































则 称 D 古 距离 函数 或 度量 





























































































































































































































































































































































































































































































































欧 去 距离 定义 


e 像素 bp(x, y) 和 qdq(s,t) 间 的 欧式 距离 定 
义 如 下 : 


D.(pgJ=VJz-s 洲 +- 直 
。 对 于 这 个 距离 计算 法 ， 具 有 与 (x 了 


距离 小 于 等 于 东 个 值 z 的 像素 是 : 包 合 
在 以 (xy) 为 圆心 ， 以 z 为 半径 的 圆 平 
面 




































































































































































































































































































































































































































































D,4 距 离 〈 城 市 距离 ) 


像 系 px, y) 和 q(s, 切 之 间 的 D, 距 
离 定 义 为 : 


D,(p,qd)=|x-sl+ ly 一 




































































































































































































































































































































































































































































D, 距 离 举 例 


e。 上 共有 王 (x, y) 距离 小 于 
等 于 有 某 个 值 z 的 那些 像 
又 形成 一 个 委 形 
例如 ， 与 点 (x, y) 〈 中 
心 点 ) D, 距 离 小 于 等 
于 2 的 像素 ， 形 成 右边 
固定 距离 的 轮 廊 

e 具有 D,， = 1 的 像素 是 

(x, y) 的 4 邻 域 







































































像素 px y) 和 dk(s, 切 之 间 的 D. 距 离 
定义 为 : 


Ds(p,q) = max(x- sl ,ly 一 二 |) 











D, 距 离 举 例 


具有 与 (zx, 马 距 离 小 于 
等 于 某 个 值 z* 的 那些 像 
么 形成 一 个 正方 形 
心 点 ) D。 距 离 小 于 等 
于 2 的 像 孙 ， 形 成 右边 
回 定 距 离 的 轮 大 

具有 D。= 1 的 像素 是 
(x, y) 的 8 邻 域 









































































































































任何 问题 ? 








研究 生 谍 程 


数字 图 像 处 理 


Dliglital Image Processlng 
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研究 生 谍 程 




































































氮 处 理 〈 变 换 ) 











空域 方法 
处 理 方法 模板 处 理 〈 滤 波 ) 
加 频 域 方法 
从 全 局 处 理 
增 处 理 策 略 
局 部 处 理 
强 
灰 度 图 像 
处 理 对 象 





彩色 图 像 











守 间 域 图 像 增强 

































































基本 概念 

~ 点 运算 

~ 代数 运算 

~ 直方 图 运算 

~ 应 用 实例 一 一 镜头 边界 的 检测 〈 补 充 知 识 ) 
e 空间 滤波 髓 

~ 平 请 空间 滤波 器 

~ 锐 化 空间 滤波 顽 










































































~ 罕 间 域 增 强 ， 对 图 像 的 像素 直接 处 理 

~ 频 域 增强 : 修改 图 像 的 傅 里 叶 变 换 〈 后 面 介 绍 ) 
。 空间 域 增强 : 8g(2 yj=TLAe yj 

~ fx, y) 是 原 图 像 

~“ g(x, 7) 是 处 理 后 的 图 像 

~ T 是 作用 于 f 的 操作 ， 定 义 在 zx y) 的 邻 域 
。 空 间 域 增强 的 简化 形式 ; =T(7) 

~ T 是 f(x, y) 在 任意 点 (xz, y) 的 灰 度 级 

~ s 是 gx, ) 在 任意 点 (xz, y) 的 灰 度 级 







































































FIGURE 3.3 Some 
basic sray-level 
transformation 
functions used for 
Imasge 
enhancement. 





区 一 1 


Output gray level.s 


3LM4 


工 /2 


ZL 


Nesgative 


LA4 


Inverse log 


工 /2 


Input gray level.7 


3 人 








所 运算 一 一 1I 反 转变 换 ，2 对 数 变 换 


。 反 转变 换 ，*= 信 -1 




































































~ [0,L- 菇 为 图 像 的 灰 度 级 。 作 用 :， 黑 的 变 白 ， 白 的 变 黑 
@ 对 数 变 换 : 5=closl(1+7) 

~ C 是 负数 

这 六 之 0 


“ 有 时 原 图 的 动态 范围 太 大 ， 超 出 某 些 显示 设备 的 允许 
动态 范围 ， 如 直接 使 用 原 图 ， 则 一 部 分 细节 可 能 丢失 


“ 解决 办 法 是 对 原 图 进行 灰 度 压 盎 ， 如 对 数 变 换 





氮 运 算 一 一 1I 反 转变 换 ，2 对 数 变换 











大 



























































。 图 a 显 示 了 值 为 0- 1.5xlg 的 傅 里 叶 频 谱 
e 在 一 个 8 位 的 系统 中 显示 





。 图 pb 显示 了 对 数 变换 在 8 位 系统 中 的 显示 结 条 


Q 


a b 

FIGURE 3.5 

(a) Fourier 
Spectrum. 

(Pb) Result of 
applying the log 
transformation 
&IVen ii 

Edq. (3.2-2) with 
C 三 1 工 . 











点 运算 一 3 寡 次 变换 

































































 c 和 7 是正 常数 
~ 7Y<1l 提高 灰 度 级 ， 在 正比 函数 上 方 ， 使 图 像 变 亮 
~ yy>1l 降低 灰 度 级 ， 在 正比 函数 下 方 ， 使 图 像 变 暗 


FIGURE 3.6 Plots 
of the equation 
ECGFP7EoOr 





一 








二 ) 矿 
六 0 various values of 
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DO 
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点 运算 一 “3 祖 次 变换 
。 例 : 人 体 胸 上 部 峭 椎 骨折 的 核磁 共振 图 像 
。7<1 提高 灰 度 级 ， 使 图 像 变 亮 。c=1 7=0.604.03 


ab 
和 
一 = 





可 适 

FIGURE 3.8 

(a) Masgnetic 
resonance (MRI) 
image of a 
fractured human 
spine- 

(b)-(d) Results of 
applying the 
transformation in 
Eq. (3.2-3) with 

CC 一 1and 

y = 0.6.0.4. and 
0.3. respectively. 
(Original image 
for this example 
courtesy of Dr. 
David R. Pickens、 
Department of 
Radiolosy and 
Radioloslcal 
Sciences、 
Vanderbilt 
University 
Medical Center.) 







































































































































































































































































































































































































































































点 运算 一 “3 靠 次 变换 
e 例 : 航空 地 面 图 像 
>] 降低 灰 度 级 ， 使 图 像 变 暗 c=1，7y = 3,4.5 


a b 
可 


FIGURE 3.9 

(a) Aerial Imasgpe- 
(Pb)-(d) Results of 
applving the 
transformation in 
正 q. (3.2-3) with 
cc 一 1and 

?y 一 3.0.4.0.and 
3.0. respectively. 
(Original 1masge 
for this example 
coOuUrtesy of 
NASAL.) 











4 对 比 度 拉 伸 
提高 图 像 处 理 时 灰 度 级 


氮 运算 


思 想 8 






































































































































































































































































































































































































































































































































































































































































































































点 运算 一 5 灰 度 级 切片 
关心 范围 指定 较 高 值 ， 关心 范围 指定 较 高 值 ， 
其 它 指定 较 低 值 其它 保 持 不 变 


a hb 

轨 固 

FIGURE 3.11 

(a) This 

transtormation 

ba3 入 hichliehts range 

4. 巨 ] of sray 

levels and reduces 
all others to a 
constant level. 
(Pb) This 
transformation 
highlishts range 

下 [4. 殖 ] Put 


工 一 1 preserves all 

















other levels. 











(Cc) An Imasge. 








(d) Result of 














using the 








transformation 








in (al). 



































a 变 换 结 宋 






















































































































































































































































































































































































































































































































































































点 运算 一 一 5 灰 度 级 切片 
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点 运算 一 一 6 位 平面 切片 
。 位 平面 切片 


假设 图 像 中 每 个 像素 的 灰 度 级 是 256， 这 可 以 用 8 位 来 表 
示 ， 假 设 图 像 是 由 8 个 1 位 平面 组 成 ， 范 围 从 位 平面 0 到 位 
平面 ?7。 其 中 ， 位 平面 0 包含 图 像 中 像素 的 最 低位 ， 位 平面 
7 包含 像素 的 最 高 位 


One 8-bit byte FlICURE 3.12 


,一 人 Bit-plane 


(most Significant ) 
representatlon 0o| 
an -bit 1mage， 


Bit-plane0 
(least Significant) 




































































































































































































































































































































































































































































点 运算 一 一 6 位 平面 切片 

。 作 用 
“ 通过 对 特定 位 提高 亮度 ， 改 善 图 像 质 量 
较 高 位 〈 如 前 4 位 ) 包含 大 多 数 视 沉重 要 数 


《如 后 4 位 ) 对 图 像 中 的 微小 细节 有 


~ 分 解 为 位 平面 ， 可 以 分 析 每 一 位 在 图 像 中 的 
相对 重要 性 

































































































































































































































































































































































































































































点 运算 一 “6 位 平面 切片 
一 幅 8 比 特 分 形 图 像 








FIGURE 3.13 An 8-bit fractal image.(A fractalis an image senerated from mathematical 
expressions).(Courtesy of Ms.Melissa D. Binde,swarthmore Collese.Swarthmore.PA.) 





并 
寂 
男 


FIGURE 3.14 The eisht bit Planes of the imasge in Fig. 3.13. The number at the bottom. 


right of each imasge identifies the bit plane. 





反 运 算 一 一 6 










































































代数 运算 

































































~ 加 

~ 减 

~ 乘 

~ 除 : 一 幅 图 像 取 反 和 另 一 幅 图 像 相 乘 

e 未 和 辑 运 算 

~ 非 

v 与 

~ 或 

~ 异 或 





代数 运算 一 一 加 法 







































































e 加 法 运算 的 定义 
CUx, y) = AUX, y) + BAX，y) 


e。 主要 应 用 举例 
~ 去 除 登 加 性 噪声 
生成 图 像 登 加 效 林 








代数 运算 一 加 法 




































































对 于 原 图 像 fx, y) , 有 一 个 噪声 图 像 集 
{ gi(x y) |} i =1,2,...N 
其 中 ，g; (xz y) = f(x, y) + hx y); 


假设 噪声 hx, y) 均值 为 0， 且 互 不 相关 

N 个 图 像 的 均值 定义 为 : 
NU 
期 盟 值 E\g(x, y)) = 工 (X，y) 


上 述 赂 像 艾 值 将 降低 噪声 的 影 啊 








代数 运算 一 一 加 法 

































































。 去 除 知 加 性 噪声 一 一 星系 图 举例 





后 加 噪声 图 像 


N=16 





N-64 N=128 














去 除 登 加 性 噪声 一 一 性 系 图 举例 


。 原 图 与 均值 图 像 的 差 值 图 像 和 直方 图 

































































关 均 
别 从、] xs | 入 
| 减 
小 

小 
标 
和 准 
像 靖 
岂 
N=128 小 























代数 运算 一 加 法 


e 生成 岁 像 登 加 效 末 

对 于 两 个 图 像 f4x y) 和 hx, y) 的 均值 有: 
g(xz y) = 1/2f(x, y) + 17/2h(x, y) 

推广 这 个 公 邢 为 : 
gx,y) = aGfGxy) + BRCX， y) 

其 中 a+B= 1 

可 以 得 到 各 种 图 像 合 成 的 效果 ， 也 可 以 用 于 
两 张 图 族 的 衔接 


































































































RN 
三 工 
| 
址 
] 忆 
荆 
全 





























































































































































































































































































































代数 运算 一 减法 


e 城 法 的 定义 
CUx,y) = AGx y) - BCx, y) 


。 主要 应 用 什 例 
7 显示 两 幅 图 像 的 差异 ， 检 测 同一 场景 两 
幅 图 像 之 间 的 变化 
如 : 视频 中 镜头 边界 的 检测 
7 去 除 不 需要 的 天 加 性 图 案 
7 图 像 分 割 :如 分 割 运动 的 车 辆 ， 减 法 去 




















掉 静 下 部分， 剩余 的 是 运动 元 素 和 噪声 

























































































































































































































































































































































































































































































































































































代数 运算 一 减法 


。 位 测 癌 一 场景 两 幅 图 像 之 间 的 变化 
议 : 时 间 1 的 图 像 为 Ti ex y) ， 
时 间 2 的 图 像 为 To 4x, 7) 


ER 9 


例 ;， 视 频 中 镜头 边界 的 检测 (后 面 介 绍 ) 




































































































































































































































































































































































































































































代数 运算 一 一 减法 


e 去 除 不 需要 的 登 加 性 图 和 
设 : 育 景 图 像 btx, y) ， 六 景 育 景 混合 图 像 
f(X，y) 

gx y) = 了 (xy) 一 bx y) 


gx, y) 为 去 除了 和 肯 景 的 网 像 。 




































































































































































































































































































































































































































































代数 运算 一 减法 


e。 去 除 不 需要 的 登 加 性 疼 各 
例 : 电视 乱 作 的 监 屏 扩 术 


问题 ? 




































































































































































































































































































































































































































































代数 运算 一 乘法 


e 乘法 的 定义 
CUx y) = A(x,y) 六 BAX,Y) 
e 主要 应 用 举例 
v 图 像 的 局 部 显示 
用 二 信守 板 图像 与 原 图 像 做 乘法 








RN 
| 
赴 
] 忆 
荆 
全 




































































































































































































































































































































































































































































代数 运算 一 1、 非 





e 非 的 定义 
0 


e。 主要 应 用 举例 
获得 一 个 阴 疼 像 
获得 一 个 子 铬 像 的 补 狗 像 








了 1 
TIT 

A 
| 


代数 运算 


一 个 阴 疼 条 


qi 


、 
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@ 本 







































































































































































































































































































































































































































































代数 运算 一 1、 非 



















































































代数 运算 一 2、 与 






























































e 与 运算 的 定义 

gx y) = fx,y) 和 hx, y) 
e 主要 应 用 举例 

w 求 两 个 子 图 像 鸭 相交 子 疼 














代数 运 







































































代数 运算 一 3、 或 


e 或 运 算 的 定义 
g(X, y) = (xy) V hx y) 
e 主要 应 用 举例 
v 合并 子 岁 像 


| 
















































































代数 运算 一 3、 或 


v 模板 运 复 : 所 取 感 兴趣 的 子 图 像 




































































人 








代数 运算 一 4、 异 或 


e 开 或 运算 的 定义 

g(x, y) = fx y) 四 hx y) 
e 主要 应 用 举例 

w 获得 相交 子 岁 像 


硬 | 本 | 












































































































































。 直方 图 均衡 化 










































































一 个 灰 度 级 在 范围 [0，L-J] 的 数字 图 像 的 直 
方 图 是 一 个 离散 函数 
h (rw = ny 
ni 古 图 像 中 灰 度 级 为 ri 的 像素 个 数 
r 是 第 k 个 灰 度 级 ，k = 0, 1 2, ..,L-1 


由 于 忆 的 增 量 是 1， 直 方 图 可 表示 为 : 
P () 一 了 
即 ， 阁 像 中 不 同 灰 度 级 像素 出 现 的 次 数 







































































































































































































































































































































































































































































直方 图 定义 


e 图 像 百 方 匈 的 定义 《〈2) 
一 个 灰 度 级 在 范围 L0，L- 匡 的 数字 图 像 的 直 
方 匈 是 一 个 离 衣 函数 
p (TU)= ni /An 


n 是 图 像 的 像素 总 数 
路 征 图 像 中 灰 度 级 为 世 的 像 系 个 数 
ri 是 第 Kk 个 灰 度 级 ，k = 0, 1 2, .…,L-1 




































































































































































































































































































































































































































































直方 图 定义 


e 两 种 图 像 百 方 和 图 定义 的 比较 
h ru)= mh 定义 (了 
p (fw= nn 定义 (2) 
有 其中， 定义 《2) 
et [0, 可 区 间 ， 成 为 实数 函 





“函数 值 的 范围 与 象 素 的 总 数 无 关 
“给 出 灰 度 级 ri 在 图 像 中 出 现 的 概率 密度 统计 

































































































































































































































































































































































































































































直方 图 定义 
e。 岁 像 百 方 铭 的 定义 举例 


Pa 




































































































































































































































































































































































































































































IarkE 1rnaEee 


卫 right 1rnaE 


IE-EGTIEFSL TIDS 世 己 


了 jh -eamtrast 1 日 E 








直方 图 均衡 化 达到 的 效果 




































































































































































































































































































































































































































































直方 图 均衡 化 


e。 有 百 亡 图 应 用 举例 一 一 直方 图 均衡 化 
希望 一 幅 岁 像 的 像 妹 品 有 全 部 可 能 的 灰 度 级 
且 分 布 苞 勺 ， 能 够 具有 部 对 比 度 
v 使 用 的 方法 是 灰 度 级 变换 : s = T(r) 
v 基 本 思想 是 把 诛 始 图 的 直方 图 变换 为 均匀 分 
布 的 形式 ， 这 样 融 增 加 了 像素 灰 度 值 的 动态 
范 围 ， 从 而 达到 增 踢 疼 像 整体 对 比 度 的 效 末 























































































































































































































































































































直方 图 均衡 化 


S=T(r) Us es | 
T) 满 足下 列 两 个 条 件 : 
CD TCD 在 区 间 0<rs1 中 为 单 值 且 单调 递增 
(2) 当 0 科 + 过 1 时 ,0 委 TGr) 科 ] 


条 件 《〈《1) 保证 鼠 赂 各 灰 度 级 在 变换 后 仍 你 持 从 尼 















































































































































到 日 《或 从 日 到 是 ) 的 排列 次 序 
条 件 〈《2) 你 证 变换 前 后 灰 度 值 动态 范围 的 一 致 性 




































































































































































































































































































































































































































































直方 图 均衡 化 


P. (是 z 的 概率 密度 函数 ，Ps) 是 s 的 概 
率 蜜 上 度 函 数 ，P_Gr) 和 TD) 已 知 ， 且 TI(s) 
满足 上 述 条 件 (1) ， 上 所 以 


Ps)= 已 人 


请 
dx 










































































































































































































































































































































































































































































直方 图 均衡 化 
已 知 一 种 重要 的 变换 函数 :* =T()= | 户 (wjav 


天 于 上 限 的 定 积 分 的 导数 殉 是 该 上 限 的 积分 值 
《 茉 布 尼 次 准则 ) 


必 _dTO) 全 Toor = Pr 人 


机 ar ar 

















直方 图 均衡 化 

































































对 于 离散 值 ; mr(o)= 起 
已 知 变换 函数 的 离散 形式 为 


8 -TCD)- 交 mmO)- 六 和 


0 





k 一 0, 1 2 一 
sk 称 作 直 方 儿 均 衡 化 


将 输入 图 像 中 灰 度 级 为 rr 〈 横 坐标 ) 的 像素 映射 
到 输出 图 像 中 灰 度 级 为 sS。《〈 横 坐标 ) 的 对 应 像素 
得 到 








直方 图 均衡 化 







































































FIGURE 3.18 1.00 
Transformation 

functions (1) 

through (4) were 

obtained from the 

histograms of the 075 
Imases in 

Fig.3.17(aj.using 

Edq. (3.3-8). 


0.25 


"0 64 128 192 255 长 







































































~ 涉及 两 幅 图 像 相 减 
v 涉及 直方 图 知识 
~ 涉及 两 幅 图 像 直 方 图 的 相 减 
e。 什么 是 镜头 ? 
e。 镜头 检测 方法 1] 一 一 连续 帧 相 减 
e。 镜头 检测 方法 2 一 一 连续 帧 的 直方 图 相 减 
e。 镜头 检测 方法 3 一 一 时 空 切片 分 析 



















































































， 


| 


下 男 电 再 本 而 男 有 加 上 





二 


从 视频 的 制造 产生 来 看 ， 视 频 由 一 个 个 镜头 
(shot) 所 组 成 


一 个 镜头 是 指 一 系列 连续 记录 的 图 像 帧 ， 用 于 
表示 一 个 时 间 段 或 相同 地 点 连续 的 动作 


镜头 由 摄像 机 一 次 摄像 的 开始 和 结束 所 决定 








什么 是 镜头 ? 


@ 份 测 到 镜头 及 由 镜头 产生 的 关键 凑 ， 可 以 : 

































































~ 近 供 基于 关键 帆 的 视频 浏览 

~ 提供 基于 内 容 的 视频 检索 和 得 询 

~ 计算 机 目 动 分 机 和 上 总结， 区 省 人 力 和 时 间 
~ 使 海量 视频 数据 的 管理 和 款 引 成 为 可 能 




















镜头 检测 方法 1 连续 帧 相 减 人 
@ 算法 原理 : 计算 相 邻 两 帧 像素 变化 的 数目 。 当 
超过 设 定 的 阔 值 时 ， 即 找到 镜头 的 边界 

@ 缺点 : 对 摄像 机 运动 敏感 ， 如 放 缩 、 平 移 


@ 解决 办 法 ， 通过 滤波 器 的 使 用 来 降低 。 在 比较 
一 帧 的 每 个 像素 前 ， 用 它 的 邻近 区 域 的 平均 值 来 代 
蔡 ， 这 也 过 滤 了 输入 图 像 的 一 些 噪 声 






































































































































。 算法 怕 理 : 统计 相 邻 两 帧 中 所 有 像素 在 

不 同 灰 度 《〈 需 色 ) 上 的 分 布 释 卉 ， 当 产 弄 

的 累加 值 超过 阔 值 T 时 ， 即 检测 到 镜头 边界 
《后 和 面 有 算法 的 详细 说 明 ) 

e 优 点 : 对 对 象 运 动 不 敏 感 ， 因 为 生 方 岁 
忽略 了 怖 内 的 空间 变化 

e。 催 扣 : 可 能 两 个 狗 像 有 次 似 的 直方 网 但 
却 是 完全 不 同 的 内 容 。 然 而 ， 这 种 事件 的 
概率 是 足 人 够 低 




































































































































































































































































































































































































































































镜头 检测 方法 2 一 “直方 图 相 减 AS 
C1) 首先 计算 相 邻 两 师 颜 色 分 布 关 值 的 均值 和 方 专 


1 4 
也 区 
了 一】 


| ] 可 二 
亚 一 了 他 (人 佑 一 癌 下 双 9a 
ii 
十 表示 策 1 斋 和 第 计 1 帧 的 区 别 ， 它 通过 下 式 计算 。 


对; -之 ja 《3 了 9 





五 if(a) 表示 第 1 帧 直方 图 的 值 : : 
忆 汪 
1 一 < 《二 
C, 是 第 1 由 中 Px 用 = 的 父 束 数目 ，C 是 第 1 帧 的 总 你 素数 .nm 是 H 种 可 能 颜色 的 一 


种 。N=4， 采 用 每 个 必 素 点 的 RGB 三 种 色 的 头 两 位 组 合 而 成 。， 
风 区 划一 (种 针 萝 >> 且 <= 划 + 人 基 >> 加 < 下 二 ( 盆 丰 及 >> 且 加 




































































































































































































































































































































































































































































镜头 检测 方法 2 一 一 直方 图 相 减 


【0)、 根 据 和 严 ， 计 熙 thresholdT+ 





到 = At+38x (0 
习 = HAxl1 (CD 
当 划 > 全 ,cut 被 榨 测 ，， 

当 了 < 厌 < 人 ,可 能 出 现 著 进 转换 ， 当 帆 间 各 标的 变化 值 想 : 斗 刚 档 涡 型 镜 头 边 媳 ， ， 
当 允 > 直流 有 出 现 镜头 边界 的 可 能 。， 

参考 文献 : 

再.J.Zhang,A.Kankanhalljlands.W.9mollar，，“ Automatic 

Parutoning of Fullj-Motuon Vldeo . ACM Multumedia system， 


Apr.1993. 

































































































































































































































































































































































































































































镜头 检测 方法 3 一 一 时 空 切片 分 析 


e 什么 是 时 衬 切 片 sSpatio-temporal Slices? 







































































































































































































































































































































































































































































镜头 检测 方法 3 一 一 时 空 切片 分 析 
。 颅 色 和 纹理 的 不 连续 ， 表 明镜 头 边 界 的 出 现 





【 乱 1 工 上 人 人 国生 丰 站 本 让 作息 生 by twWrD CULES 


【1 工 WD 全 IO 各 下 DLL 世 记 人 全 全 Dr 下 证 所 


re 
1 


【CT 工 WWrD ETLD 上 号 DIECEe 本 by 乱 全 3SOLYe 





Figrure 机 .4 Samples of speatio-temporal slices. 

































































































































































































































































































































































































































































statie Pan statc Pan Imultiple motions zoom 





Intense of motion Opposlte mothon 由 rection camera break 


Figure 之 沁 Patterng in a spatio-temporal lice、 

































































































































































































































































































































































































































































镜头 检测 方法 3 一 一 时 空 切片 分 析 





e。 人 参 雾 文献 : 
CC.W.Ngo, 上 .C.Pong,and 了.I.Chin.”“Vldeo Parttoning by 


Temporal sllce Coherency . IEEE Iransactlons on Clrcults and 
Systemas for Video Technology, Aug.2001. 




































































































































































































































































































































































































































































空间 域 图 像 增强 
e 基础 知识 

基本 概念 

~ 点 运算 

~ 代数 运算 

~ 直方 图 运算 

~ 应 用 一 镜头 边界 的 检测 
e 宝 间 滤波 器 

~ 平 清 空间 滤波 器 

~ 锐 化 空间 滤波 器 




































































































































































































































































































































































































































































宇 间 滤 疲 需 


。 至 间 滤 波 和 和 空间 滤波 器 的 定义 
使 用 空间 模板 进 行 的 狗 像 处 理 ， 被 称 
为 空间 滤 疲 。 模 板 本 身 被 称 为 空间 滤波 




































































。 在 MxN 的 图 像 F 上 ， 使 用 ”ze 的 滤波 器 : 
3 
其 中 ，m=2a+l, n=2b+1， 
wks, t) 是 滤波 如 系 数 ，f\x, y) 是 图 像 人 
。 空间 滤波 的 简化 形式 
及 = 人 如 十 YDZD 十 .十 WO CC = >》Wz 
四] 


其 中 ，w 是 滤波 器 系数 ，z 是 与 该 系数 对 应 的 图 
像 灰 度 值 ，m 为 滤波 吉 中 包含 的 像素 所 总 数 




































































。 平 请 空间 滤波 肯 的 作用 


“ 模糊 处 理 : 去 除 图 像 中 一 些 不 重要 的 细 丰 
7 减 小 噪声 
。 平 滑 空间 滤波 器 的 分 类 
“ 非 线性 滤 肖 需 
> 最 大 值 滤 流 需 
> 中 值 滤波 器 
> 最 小 值 滤 流 需 














。 包含 在 滤 肖 器 邻 域内 像素 的 平均 值 ， 也 


。 作 用 
~ 沽 小 图 像 灰 度 的 “尖锐 ”变化 ， 减 小 噪 
声 


” 由 于 图 像 边缘 是 由 图 像 区 上 度 尖锐 变化 
引起 的 ， 所 以 也 存在 边缘 模糊 的 问题 


















































































































































图 a 是 标准 的 像素 平均 值 
图 b 是 像素 的 加 权 平 汐 ， 衣 明 一 些 像素 更 为 重要 
> >》 vs,tJFz+sy+H) 


S 一 一 Qt 一 一 D 


y》 5 


S 一 一 Qt 一 一 D 


gs(xy)= 





线性 滤波 吉 一 一例 1 






























































多 贸 
人 @e@e@ 本 X 3 
ZE 2 
TS LA 
人 区 


aaaaaaa0 aaaaaaaa 





9 
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5 5 心 人 9Xg9 
中 IN 


aaaaaaa10 








aaaaaaana8 





站 汪 9 


) 用 








线性 滤波 融 一 一 例 2 
提取 感 兴趣 物体 而 模糊 图 像 


原 图 15 X 15 阔 值 二 25% x b 图 像 的 最 高 亮度 








二 | 罗汉 


FIGURE 3.36 (a) Imasge from the Hubble Space Telescope.(Pb) Image Processed byal3 X 13 averasling maskK. 
(C) Result of thresholdins (Pb). (Orisinal Image couUrtesy of NANA.) 


统计 排序 滤 流 器 







































































“ 征 一 种 非 线性 滤波 甫 


~ 基于 滤波 器 所 在 图 像 区域 中 像素 的 排序 ， 由 
排序 结果 决定 的 值 代 替 中 心 像素 的 值 


。 分 关 


中 值 滤 汲 器 : ”用 像素 领域 内 的 中 间 值 代 蔡 该 像素 
“ 最 大 值 滤波 器: 用 像素 领域 内 的 最 大 值 代 替 该 像素 
最 小 值 滤波 器 : 用 像素 领域 内 的 最 小 值 代 蔡 该 像素 








统计 排序 滤波 甫 

































































主要 用 途 : 去 除 噪声 


e 最 大 值 滤 波 需 
v 主要 用 途 : 寻找 最 觉 点 
“计算 公式 : R = max {z | k= 
e 了 最 小 值 滤 波 需 
v 主要 用 途 : 寻找 最 蜡 点 





v 计算 公 去 : R = mid {2z， 村 


上 一 
广 


v 计算 公 去 : R = min {2z， | kk=12... 





.TD} 




































































































































































































































































































































































































































































中 值 滤波 天 


e 中 值 滤波 的 原理 
用 模板 区 域内 像素 的 中 间 值 ， 作 为 结果 值 
R = mid {z， | Kk = 1 2，...，,D] 





“ 踢 迫 突出 的 完 点 《上 蜡 氮 ) 更 象 它 周围 的 值 ， 
以 消除 扳 立 的 完 扣 〈 蜡 点 ) 


Em 中 







































































































































































































































































































































































































































































中 值 滤波 天 


e 中 但 滤 肖 算法 的 实现 
“将 梗概 区 域内 的 像素 排序 ， 求 出 中 间 值 
例如 : 3x3 的 模板 ， 第 5 六 的 是 中 值 ， 
5x5 的 模板 ， 第 13 大 的 是 中 值 ， 
7x7 的 模板 ， 第 25 大 的 是 中 值 ， 
9x9 的 模板 ， 第 41 大 的 是 中 值 。 


“对 于 辣 值 像 么 ， 连 续 排列 。 
如 〈10, 15, 20, 20, 20, 20, 20, 25, 100 ) 

































































































































































































































































































































































































































































中 值 滤波 天 





e 中 人 小 六 得 法 的 特 操 


“区 地 陈强 是 风 同 用 可 以 比较 好 地 保 
留 边 的 锐 度 和 图 像 的 细 《〈 优 于 均 介 
滤 妆 上 需 ) 

































































































































































































































































































































































































































































中 值 滤波 天 





原 图 3x3 均 值 滤波 3x3 中 值 滤波 





5 疝 四 了 


FIGURE 3.37 (a) X-ray Image of circult board corrupted by salt-and-pepper nolse.(b) Noise reduction with a 
3 X 3averasing mask.(c) Noise reduction witha3 X3median filter.(Original imasge courtesy of Mr.Joseph 
E. Pascente. LiXl. Inec.) 

































































































































































































































































































































































































































































最 大 值 滤波 船 
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了 
YY 
YY 


s 
YY 
4 


最 小 值 







































































































































































































































































































































































































































































锐 化 滤 流 秀 


e 饥 化 滤 度 融 的 主要 用 放 
~ 突出 铬 像 中 的 细节 ， 增 强 被 模糊 了 的 细 下 
人 
“超声 探测 成 像 ， 分 辨 率 低 ， 边 缘 侦 糊 ， 通 过 

锐 化 来 改 壮 

“ 岁 像 识别 中 ， 分 割 前 的 边缘 提取 
~ 锐 化 处 理 恢复 过 度 钝 化 、 暴 光 不 足 的 图 像 
v 尖 站 下 并 的 目标 识别 、 定 位 




































































































































































































































































































































































































































































锐 化 滤 流 秀 


e 做 分 滤波 带 的 忌 理 
“均值 产生 犯 化 的 效 末 ， 而 均值 与 积分 相 
似 ， 由 此 而 联想 到 ， 微 分 能 不 能 产生 相反 
的 效 朱 ， 即 锐 化 的 效果 ? 结论 是 肯定 的 。 
* 在 独 像 处 理 中 应 用 微分 最 香 用 的 方法 是 计 
算 榜 度 。 冰 数 ftx, 7 在 (zx 7 处 的 风 度 为 


一 个 回 量 : 


CJ1 
6 OX 
7 6 


Oy 


锐 化 滤 流 秀 


e 锐 化 滤波 融 的 分 关 
“二 阶 微分 滤波 郁 一 拉 普 拉 斯 算 子 










































































“一 阶 微分 滤波 豆 一 柳 度 算 子 





拉 普 拉 斯 算 子 







































































光 2 
OX Oy 





9“ 
= (xz+Lyj+ Flxz-Ly)-27(cy) 





0“j 
=ley+U+Hey-U-2H(x y 
Oy 


V-F=|Alx+ly+Hz-l yjHH(zy+J+F(ey- 吕 -4 y] 




































































拉 普 拉 斯 算 子 





1 1 
FL YI 


f (x+1, y+1l) 








a b 
加 间 


FIGURE 3.39 

(al) Filter mask 
Used to 
Implement the 
digital Laplacian， 
as defined in 

Eq. (3.7-4). 

(b) Mask used to 
implement an 
extension of this 
equation that 
includes the 
diacgonal 
nelghbors.(c) and 
(d) Two other 
implementations 
of the Laplacian. 





拉 普 拉 斯 算 子 


e 拉 普 拉 斯 变换 对 图 像 增强 的 基本 方法 
CC- Flxy)-V“rley) 
S “yy /一 5 
Feyj+V-freocy) OO) 


(1 用 于 拉 普 拉 斯 模板 中 心 系数 为 负 
(1 用 于 拉 普 拉 斯 模板 中 心 系数 为 正 










































































拉 普 拉 斯 算 子 一 例 

































































原 图 :月 球 北极 拉 普 拉 斯 滤波 后 的 图 像 








a b 

| 

FIGURE 3.40 

(a) Imase of the 
North Pole of the 
ImIOOTD . 

(Pb) Laplacian- 
fltered Imasce. 
(c) Laplacian 
Imase scaled for 
display PuUrPoses. 
(d) Imase 
enhanced by 
Usings 下 q. (3.7-3). 
(Original 1mage 
courtesy of 


NASAL.) 


3X3， 中 
心 点 为 一 8 
的 掩 腊 


原始 图 像 
十 拉 普 拉 
斯 的 络 果 





拉 普 拉 斯 算 子 







































































=jeyLUeerlyHHEclyHcyH+Hcy- 吕 -4 
-Seyj-erlHrE-LHAyrD+ey 
(7)= /oo yj+V Hocy) 
=jteyHecrlyHe-lyreyrD+Ay 用 -41 四 
-LerLyHHe-LHoy+JHA 7 中 -37 










































































FIGURE 3.41 (a) Composite Laplacian mask. (Pb) A second compeosite mask. (c) Scanninsg 
electron microscope imagse. (d) and (e) Results of fltering with the masks In (a) and (Pb)、 
respectively. Note how much sharper (ej isthan (d). (Orisinal image courtesy of Mr. Michael 
Shatfter Department of Geoloslical Sciences. University of Oreson. Eusene.) 
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俩 度 算 子 


e 芳 夸 一 个 3x3 的 图 像 区 域 ，z 代 表 
灰 度 级 ， 上 陈 在 点 2 的 VE 值 可 用 
c, = 站 用 (zs - 2 ) 近似 
世人 用 人 六 达 催 ， 























































































































































































































































































































俩 度 算 子 


e 问 量 模 值 的 近似 计算 
用 绝对 信奉 换 平 方 和 平方 根 有 : 
Vy = lc :| ec 
= |G ,|+ [四 


e 和 伏 分 过 小 套 的 忆 理 


ViTf % 下 攻 | 十 | 训 二 


















































































































































另外 一 种 计算 方法 是 使 用 交叉 差 : 
VT ss [(ze - Z5)2 + (z8 一 Z6)23]172 


> 12g 一 25| + |z8 一 26 

































































































































































































































































































































































































































































俩 度 算 子 


e 和 化 分 滤波 右 模 板 系 数 设计 
Roberts 交 叉 李 度 算 子 


wvPrewitt 要 上 度 算 子 


Sobel 李 皮 算 子 







































































































































































































































































































































































































































































微分 滤 肖 器 模板 系数 设计 


eRoberts 交 义 樟 度 算 子 
旦 二 吉 下 调 上 攻 本 1 辣 


“ 樟 度 计算 由 两 个 模板 组 成 ， 第 一 个 求 
得 榜 度 的 第 一 项 ， 第 二 个 求 得 棉 度 的 
第 二 项 ， 然 后 求 和 ， 得 到 棉 度 。 


v 两 个 模板 称 为 Roberts 
交叉 梯度 算 子 - 一 







































































































































































































































































































































































































































































微分 滤 肖 器 模板 系数 设计 


ePrewitt 椰 度 算 子 
估 





3x3 的 梯度 模 


| 


| 







































































































































































































































































































































































































































































微分 滤波 髓 模板 系数 设计 
e Sobe]1 梯 上 度 算 子 一 一 3x3 的 梯度 模板 





| 




































































































































































































































































































































































































































































数字 图 像 处 理 〈2 ) 


任何 问题 ? 





研究 生 谍 程 


数字 图 像 处 理 


Dlgital Image Processlng 


形 衬 新 
北 各 大 学 计算 机 科学 技术 研究 所 


FE mall:pengyuxin@licst. pku. edu. cn 








彩色 图 像 处 理 

。 彩 色 基 础 知识 

。 彩色 空间 

。 伪 彩色 处 理 

e。 全 彩色 图 像 处 理 

。 彩色 变换 

。 彩色 图 像 平滑 和 尖锐 化 





彩色 图 像 基础 





。 为 什么 要 研究 彩色 图 像 处 理 ? 

符合 人 类 视觉 特 扩 
> 人 类 可 以 辨别 几 千 种 颜色 色调 和 腕 度 
> 只 能 辨别 几 十 种 灰 度 层次 

~ 有 用 的 描绘 子 
> 简化 目标 物 的 区 分 


> 目标 识别 : 根据 目标 的 颜色 特征 








彩色 图 像 基 础 
e 彩色 图 像 处 理 可 分 为 : 
~ 全 彩色 处 理 
> 数码 相机 
> 数码 摄像 机 
> 彩色 扫描 仪 
v 伪 彩 色 处 理 
> 对 不 同 的 灰 度 或 灰 度 范围 赋予 不 同 的 颜色 





彩色 图 像 基础 


当 一 束 日 光 通 过 一 个 琉璃 棱镜 时 ， 出 现 的 光束 
不 是 白光 ， 而 是 由 一 跨 为 紫色 到 允 一 问 为 红色 的 
连续 彩色 谱 组 成 








酉 丁 画 因 轴 下 及 由 内 E 记 





彩色 图 像 基础 





。 光 特性 是 颜色 科学 的 核心 
。 手 述 彩色 光 的 3 个 基本 量 : 
v 辐 届 率 : 从 光源 流出 能 量 的 总 量 ， 用 瓦特 (由 


度量 
~ 光 强 : 观察 者 从 光源 接收 的 能 量 总 和 
~ 亮度 : 主观 描绘 子 





彩色 图 像 基础 


e。 三 原色 

vv 红色 〈Red) 、 绿 色 (Green) 、 赣 色 〈Blue) 
原色 相 加 可 产生 二 次 色 

v 深 红色 : 红 十 蓝 

青色 : 绿 十 赣 

“ 黄 ” 色 : 红 十 绿 
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彩色 空间 〈 也 称 彩 色 模 型 或 彩色 系统 ) 


e 下 GB 

e CMY 和 CMYK 
e 由] 

e YIQ 

e YUV 

e YLbCr 








彩色 空间 〈 也 称 彩 色 模 型 或 彩色 系统 ) 忆 w 水 


e RGB 
~ CCD 技 术 直 接 感知 R, G, B 三 个 分 量 
~ 是 图 像 成 像 、 显 示 、 打 印 等 设备 的 基础 





CMY 和 CMYK 彩 色 空 间 攻 
。CMY( 青 、 深 红 、 黄 ) 、CMYK (〈 青 、 深 红 、 
黄 、 黑 ) 
~ 运用 在 大 多 数 在 纸 上 沉 积 彩 色 颜 料 的 设备 ， 
如 彩色 打印 机 和 复印 机 
 CMYK 


> 打印 中 的 主要 颜色 是 黑色 
> 等 量 的 CMY 原 色 产 生 黑 色 ， 但 不 纯 
> 在 CMY 基 础 上 ， 加 入 黑色 ， 形 成 CMYK 彩 色 


空间 





彩色 空间 〈 也 称 彩色 模型 或 彩色 系统 ) 民 水 
HSI (色调 、 饱 和 度 、 亮 度 ) 

~ 两 个 特 氮 : 
> I 分 量 与 图 像 的 彩色 信息 无 关 
> H 和 S 分 量 与 人 感受 颜色 的 方式 是 紧密 相连 的 

~ 将 亮度 (IT) 与 色调 〈H) 和 饱和 度 〈S) 分 开 

~ 避免 颜色 受到 光照 明 蜡 (D) 等 条 件 的 干扰 

~ 仅仅 分 析 反 映 色 彩 本 质 的 色调 和 饱和 度 

广泛 用 于 计算 机 视觉 、 图 像 检索 和 视频 检索 





TR 
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Hi 













彩色 空间 《也 称 彩 色 模 型 或 彩色 系统 ) 
e YIQ 
~ Y 指 亮度 (Brightness), 即 灰 度 值 
~ 工 和 0Q 指 色调 ， 描 述 色 彩 及 饱和 度 


~ 用 于 彩色 电视 广播 ， 被 北美 的 电视 系统 
所 采用 〈 属 于 NTSC 系 统 ) 


~ Y 分 量 可 提供 黑白 电视 机 的 所 有 影像 信 
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ee 













彩色 空间 〈 也 称 彩 色 模 型 或 彩色 系统 ) 
。YUV 
~ Y 指 亮度 , 与 YIQ 的 Y 相 同 
~ U 和 V 也 指 色调 ， 不 同 于 YIQ 的 I 和 0 
~ 用 于 彩色 电视 广播 ， 和 被 欧洲 的 电视 系 
统 所 采用 《属于 PAL 系 统 ) 


风 人 日 电视 机 的 所 有 影像 












彩色 空间 〈 也 称 彩 色 模 型 或 彩色 系统 ) 忆 沁 


e YLbCT 
~ Y 指 亮度 , 与 YIQ 和 YUV 的 Y 相 同 
~ Cb 和 Cr 由 U 和 V 调 整 得 到 
~ JPEG 采 用 的 彩色 空间 





彩色 空间 转换 








1 人 RGB CMY 
2 RoB < ”有 耻 [ 
3 RaB < ”YIQ 
4 人 RGB < YUV 
5 了 RGB < 一 YLbCr 











1、RGB CMTY 
全 1 | 太 
h 人 4 | =|11-C 
4 1] 1 


RGB 和 CMY 值 都 归 一 化 到 [0, 1 











w 王 2 


-了 (R+G+B) 
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FIGURE 6.16 (a) RGB imase and the components of its corresponding HSI imasge: 
(Pb) hue.(c) saturation, and (d) intensitV. 
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伪 彩 色 图 像 处 理 


。 什么 叫 伪 彩色 图 像 处 理 ? 
“ 也 叫 假 彩 色 图 像 处 理 
~ 根据 一 定 的 准则 对 灰 度 值 赋 以 彩色 的 处 理 
~ 区 分 : 伪 彩 色 图 像 、 真 彩色 图 像 、 单 色 图 像 
。 为 什么 需要 伪 彩 色 图 像 处 理 ? 
人 类 可 以 辨别 上 千 种 颜色 和 强度 
~ 只 能 辨别 二 十 几 种 灰 度 








伪 彩 色 图 像 处 理 


。 应 用 
“ 为 人 们 观察 和 解释 图 像 中 的 灰 度 目标 


e 怎样 进行 伪 彩 色 图 像 处 理 ? 
1， 强 度 分 层 技术 
2， 灰 度 级 到 彩色 转换 技术 





1、 强 度 分 层 技术 


e。 把 一 幅 图 像 描述 为 三 维 函 数 (xz, y fx, y) ) 
。 分 层 技 术 : 放置 平行 于 (x, 7 坐标 面 的 平面 








区 
FIGURE 6.18 Geometric interpretation of the intenslty-slicing technique. 








1、 强 度 分 层 拉 术 一 和 定义 


令 [0,L-]H 表 示 灰 度 级 ， 使 1 代表 黑色 (fx y)=0) ， 


] 1 代表 白色 (ff(x y)=L-1) 。 假 设 垂 直 于 强度 轴 的 P 
个 平面 定义 为 量 级 1], 1。 ..., ]*。0<P<L-1，P 个 平面 
将 灰 度 级 分 为 P+1 个 间隔 ，V, V。，.…,Vpi， 则 灰 上 级 
到 彩色 的 贱 值 关系 : 


joy=c jc yje 从 
cf 是 与 强度 间隔 W 第 K 级 强度 有 关 的 类 色 
友 是 由 在 1]=k-1 和 1=Kk 分 割 平 面 定 义 的 








1、 强 度 分 层 技术 





ft LOT 


凤 


灰 度 级 


[ 1 Ts | 
Gray jevels 


FleURE 6.19 An altermnative representatlon of the IntensitV-slicine technigue， 





例 1: 甲状 腺 模型 
单 色 图 像 强度 分 层 结果 ，8 个 彩色 区 域 
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FIGURE 6.20 (al) Monochrome Imase ofthe Picker IThvyroild Phantom.(P) Resultof den- 
sitvy slicing Into elght colors. (Courtesy of Dr. J L. Blankenship、Instrumentation and 
Controls Division. Oak Ridese National Laboratory. ) 


左 图 的 恒定 强度 难以 区 分 病变 ， 右 图 强度 分 层 绪 宋 ， 
清楚 的 显示 恒定 强度 的 不 同 区 域 





例 2: 焊 扣 问 题 检测 


a 
b 


灰 度 关 | FIGURE 6.21 
僵 图 像 灰 2DD 9 让 Monochrome 


X-ray imase of a 
weld.(b) Result 


蝗 Y of color coding. 
焊 YY 加 题 ae 人 
OUTtesy 0 
X TEK Re 


Ltd.) 


e 给 255 灰 度 赋 以 一 种 
颜色 ， 其 它 为 另 一 种 颜色 








e。 简化 工作 ， 降 低 误 识 率 








e 图 a: 图 像 的 强度 值 下 接 与 降雨 相对 应 ， 目 测 困难 
e 图 b: 赣 色 表示 低 降 雨量 ， 红 色 表 示 高 降雨 量 


e 图 c 和 图 d 更 加 清楚 








3 hb 


C dd 
FIGURE 6-22 (al) Gray-scale imase in which intensity (in the Hishter horizontal band shown)j corresponds to 
averase monthly rainftall (b) Colors assigned to intensity values.(c) Colorcoded imase- (d) Zoom ofthe South 


America resion. (Courtesy of NASA.) 





2、 灰 度 级 到 彩色 的 转换 


e 对 任何 输入 像素 的 灰 度 级 执行 3 个 独立 变换 
e 3 个 变换 结果 分 别 达 入 彩色 监视 器 的 红 、 绿 、 
竟 三 个 通道 


。 产生 一 幅 合成 图 像 


Red Ps 率 


CTeen 
J(x. Y) transformation IE 和 TJGCx、 y) 













Blue 
transformation EEE 短 s BC Y) 


FIGURE 6.23 Functional block diasram for Pseudocolor Image Processing. 六 .大 :and 广 
are fed into the correspondins red. sreen. and blue Inputs of an RGB color monlitor. 
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全 彩色 图 像 处 理 基 础 
。 全 彩色 图 像 处 理 研究 分 为 两 大 关 ; 
v 分 别处 理 每 一 分 量 图 像 ， 然 后 ， 合 成 彩色 图 像 
~ 直接 对 彩色 像素 处 理 : 3 个 颜色 分 量 表示 像素 
向 量 。 令 c 代 表 RGB 彩 色 空 间 中 的 任意 向 量 
CR 人 
c=| ce |=|C 
CP 已 








全 彩色 图 像 处 理 基 础 
“对 大 小 为 MxN 的 图 像 
CR (cy R( y 
ceo)=|ccee7 镍 =| Ge y) 
CP (zx y) B(7X， y) 
X 三 UL2...A 一 ] 
yy 三 U12...,AN 一 | 
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彩色 变换 
。 彩色 变换 函数 


gocy=TLe 





fx y) 是 彩色 输入 图 像 
stxy) 是 变换 或 处 理 过 的 彩色 输出 图 像 
7 是 在 空间 邻 域 ey) 上 对 z 的 操作 








彩色 变换 

e。 彩色 变换 的 简单 形式 
8 = 太太 】 

六 和 8 是 fcy) 和 s(*y) 在 任何 点 处 彩色 分 量 的 


变量 
世 ,7…7 上 是 一 个 对 夺 操 作 产 生 * 的 变换 或 彩色 映 
射 函数 集 
选择 的 彩色 空间 决定 n 的 值 ， 如 RGB 彩色 空间 ，n=3， 
ri Ts 和 Ts 表示 红 、 绿 、 赣 分 量 ;CMYK， 则 n=4 


[一 ].2....， 77 





彩色 变换 


上 月 Full 通 记 
叹 - 
二 


二 于 














草 霉 和 咖啡 杯 的 彩色 图 像 
深 红 V 二 


人 gt CCMYK 图 像 ， 可 知 草莓 由 
深 红 和 黄 组 成 


厦 和 RGB 图 像 ， 红 色 多 而 赣 色 和 绿色 少 


二 






本 











TTRT…、 
了 
产 二 和 
车 
LE 靖 


补 色 : 在 如 图 所 示 的 彩色 环 上 ， 与 一 种 色调 直接 
相对 立 的 一 种 色调 称 为 补 色 


FIGURE 6.32 
Complements on 


he color circle. 





Creen “2 Yello 


作用 : 增强 筷 在 彩色 图 像 暗 区 的 细节 


补 色 
红色 在 补 色 中 用 青色 代 蔡 ， 黑 色 在 补 色 中 用 白色 代 车 


a b 

va | 

FIGURE 6.33 

Color 
complement 
transtormations. 
(a) Original 
1masge. 

(Pb) Complement 
transtormation 
functions. 

(c) Complement 
of (a) based on 
the RGB mappinsg 
functions. (d) An 
approximation of 
the RGB 
complement using 
HSI 
transtormations. 


HSI 
补 图 





























HSI 颜 色 空 间 下 的 直方 图 均衡 化 
os =rCou- 了 机 


FIGURE 6.37 
Histosram 
equalization 
(followed by 
saturation 
adjustment) in the 
HSJL color space. 


处 理 前 ， 大 量 暗 彩 色 








熏 


原 图 


Histogram before Processing 
(median = 036} 





| Histogram after Processing 
| [median = 05) 






处 理 后 的 直方 图 


增加 图 像 的 饱和 度 
这 因 为 强度 改变 影响 
图 像 的 彩色 状态 
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彩色 图 像 平 请 


令 $ ,表示 在 RGB 彩色 图 像 中 定义 一 个 中 心 在 (xy) 
的 邻 域 的 坐标 集 ， 在 该 邻 域 中 RGB 分 量 的 平均 值 为 


cy)=。 Doesy) 


(xz,yjss。 





证 RCr,yI) 


cr,y)= es >) 


了 
了 y ) 








彩色 图 像 平 滑 xs 平均 模板 ) 





a b 

C dd 

FIGURE 6.38 

(a) RGB imasge. 
(b) Red 
component Imase. 
fcC) Green 
component. 

(d) Blue 
component. 






彩色 图 像 平滑 





H 分 量 图 像 


中 | 黄 匡 


FIGURE 6.39 HSl components of the RGB color imase in Fle. 6.38(a). (al) Hue.(b) saturatlon.(c) Intensity. 





彩色 图 像 平滑 〈HSI 图 像 仅 仅 处 理 强度 4 
分 量 ) 
5X5 的 灰 度 平均 模板 平 请 结果 


wa 的 妆 而 图 和 


RGB 图 像 显示 











ao 加 图 a 图 b 图 c 
Ht 人 SnlO ng Wi 二 aoX>ave ng mask. 1i) Result of proc 人 ich RGB component 
1ag 二 刘 TOC ntensity component of the HSI imase 有 InV En 机 ) RGB. (c) Dit- 


二 汪 计 ee 而 图 b 仅 仅 是 强度 的 
平均 ， 原 彩色 〈 色 调 H 和 饱和 度 S) 保持 不 变 








彩色 图 像 尖锐 化 〈 拉 普 拉 斯 微分 所 
RGB 彩色 空间 ， 分 别 计算 每 一 分 量 图 像 的 拉 普 拉 斯 变换 
V “<R(rz,y) 
V [ed ,yj)= lyY cy) 
VB(xz,y) 
go y)= Foy)-VY oo y) 
=je 让 LEH-Ly+eyHHy 央 -4 中 


-51ey-HAarDHH-L7Hey+D+AEy-] 





彩色 图 像 尖锐 化 〈 拉 普 拉 斯 微分 ) 








图 6. 38RGB 图 像 的 “图 6. 39HSI 图 像 的 强度 I a 图 像 和 b 图 像 的 
拉 普 拉 斯 变换 分 量 图 像 的 拉 普 拉 斯 变换 “差别 图 像 





国 师 医 图 a 图 b 图 c 


FIGURE 6.41 Imasge sharpening with the Laplacian.(a) Result of processinsg each RGB channel. (b) Result of 
Processinsg the intensity component and converting to RGB.(c) Difference between the two results. 


图 c 的 原因 : 图 a 像 素 的 锐 化 是 不 同 彩 色 的 锐 化 ， 而 图 b 仅 仅 是 强度 的 
锐 化 ， 原 彩色 〈 色 调 H 和 饱和 度 S) 保持 不 变 








彩色 分 割 〈 把 一 幅 图 像 分 成 区 域 ) 
e。HSI 彩 色 空 间 分 割 一 一 直观 

“ 了 色调 图 像 方便 摘 述 彩色 

~ $ 饱 和 度 图 像 做 模板 分 离 感 兴趣 的 特征 区 
~ IT 强度 图 像 不 携 市 彩色 信息 


e。 RGB 彩色 空间 一 一 直接 





HSI 彩 色 空 间 分 割 








浆 值 产生 的 二 值 图 像 : < 区， 
饱和 度 图 像 中 靖 值 等 于 “ 旋 人 


最 大 饱和 度 的 10%， 大 于 s 医 
闵 值 的 像素 赋 1， 其 它 赋 0 回国 


AN (5 
辣 


阀 值 产生 的 二 值 图 像 


色调 模板 的 直方 图 
0. 9 的 像素 阔 值 

















RGB 彩色 空间 分 割 2 
令 z 代 表 RGB 空 间 中 的 任意 一 点 ，a 是 分 制 
疝 色 样本 集 的 平均 颜色 同 量 
Jlzqj=|z-d= (到 -ct +(ca -co +(Z 一 0 
D, 是 距离 冰 值 
如 果 zzeqsRa ， 则 z 和 a 相 似 
如 果 杰 q> 马 ” 则 z 和 a 不 相似 








RGB 彩色 空间 分 割 


并 
b 


FIGURE 6.44 
Segmentation in 
RGB space. 

(a) Oricinal 1magce 
with colors of 
interest shown 
enclosed by a 
rectangle. 

(b) Result of 
Segmentation in 
RGB vector 
space. Compare 
with Fig. 6.42(h). 








数字 图 像 处 理 〈3) 


任何 问题 ? 
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基于 内 容 的 图 像 检索 
@ 为 什么 需要 基于 内 容 的 图 像 检索 ? 
e 查询 方式 ， 查 询 demo， 现 有 系统 简介 
e 具体 内 容 
~ 特征 提取 
~ 相似 度 匹 配 
~ 相关 反馈 
~ 索引 结构 
e MPEG-7 介 绍 : 性 能 评价 等 
e 思考 的 几 个 问题 ? 








为 什么 需要 基于 内 容 的 图 像 栓 索 ? 


e。 当前 图 像 彤 容 的 特征 
v 海量 的 图 像 凡 容 出 现 
> 人 类 已 有 的 : 历史、 地理、 军事、 医学.… 
> 每 天 新 增 的 : 数码 相机 、 互 联网 
~ 图 像 内 容 的 特征 : 没有 索引 、 目 录 或 摘要 
~ 怎样 找到 需要 的 图 像 ? 








为 什么 需要 基于 内 容 的 图 像 检 索 ? 
e。 基于 文字 找 述 的 图 像 检 款 
~ 丰富 的 图 像 内 容 很 难 用 文字 来 全 面 描述 
v 文字 的 选取 因 人 而 异 ， 带 有 很 大 的 主观 性 
~ 耗费 大 量 的 人 力 和 时 间 
。 结论 : 对 于 海量 的 图 像 ， 基 于 人 工 标注 文 
字 的 检索 已 不 可 能 
e。 问题 : 目前 搜索 引擎 提供 的 基于 文字 的 入 
像 检 款 ， 能 够 解雇 问题 吗 ? 解决 得 好 吗 ? 








为 什么 需要 基于 内 容 的 图 像 检索 ?  “@ 
。 为 什么 需要 对 于 内 容 的 图 像 检索 (CBIR) ? 
“提供 图 像 的 检索 功能 


不 需要 人 手工 标注 ， 计 算 机 目 动 分 析 和 检索 ， 
万 省 人 力 和 时 间 


v 使 海量 图 像 的 管理 和 索引 成 为 可 能 
存在 的 问题 : 
> 人 类 高 级 语义 特征 与 计算 机 底层 特征 表示 的 矛盾 
> 查询 方式 问题 





基于 内 容 的 图 像 检索 
@ 为 什么 需要 基于 内 容 的 图 像 检 索 ? 
e 查询 方式 ， 查 询 demo， 现 有 系统 简介 
e 具体 内 容 
~ 特征 提取 
~ 相似 度 匹 配 
~ 相关 反馈 
~ 索引 结构 
e MPEG-7 介 绍 : 性 能 评价 等 
e 思考 的 几 个 问题 ? 











基于 内 容 的 图 像 检 索 
e。 得 询 方式 


j 用 采样 独 像 : 选择 图 像 数 据 库 中 的 图 像 
~ 利用 范例 匈 像 : 来 目 图 像 库 乙 外， 用 户 目 己 拥 供 


~ 利用 局 部 岁 像 : 先 提 取 疼 像 区 域 ， 再 利用 该 图 像 区 域 
检索 ;或 利用 不 同 图 像 的 不 同 区 域 的 拼图 


~ 利用 绘制 冬 像 : 用 户 绘制 出 来 的 独 作 为 查询 图 像 ， 描 
述 用 户 的 检 圭 目标 或 场景 


> 齐 图 : 简单 的 妹 挡 ， 用 户 期 望 的 目标 形状 
> 绘画 : 用 颜色 描绘 图 像 区 域 及 区 域 的 空间 分 布 
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基于 内 容 的 图 象 检 索 系 统 (了 ires) 演示 系统 
帮助 文档 
晴 查询 例子 人 本 

图 像 浏览 这 是 浏览 类 别 - 山 一 的 结果 ， 请 选择 样 例 图 像 进行 检索 
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进行 检索 的 样 例 图 像 : 
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图 像 检索 
联系 我 们 每 页 12 幅 /第 2 页 / 共 5 页 
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基于 内 容 的 图 像 检 索 


。 现 有 系统 
~ QBIC 








 V1ITfrage 
Photobook 
w VisualSEFK 
MARKRs 








基于 内 容 的 图 像 检 索 
e@QBIC(Query By Image Content) 


w IBM 研 制 开 发 

v 文 持 图 像 例 于、 绘制 草图 或 定制 图 像 特 征 模板 
来 检索 图 像 库 

~ 颜色 使 用 RGB, YIQ, Lab 和 MTM 颜 色 空 间 

~ 纹理 使 用 改进 的 Tamura 表 示 : 粗糙 度 ， 对 比 度 
和 方 问 性 等 

~ 形状 特征 有 目标 面积 、 各 阶 矩 、 离 心率 和 主轴 方向 等 

~ 草图 特征 ， 如 边界 各 点 的 切线 方向 等 

~ 开发 了 基于 聚 类 的 索引 技术 





基于 内 容 的 图 像 检 索 





Virage 的 VIR Image Engine 
~ 类 似 于 QBIC 系 统 


特色 : 将 特征 进行 归 闪 ， 用 户 碍 询 时 可 以 
对 特征 进行 任意 组 合 


Photobook 


w MIT 媒 体 实 验 室 开发 


~ 首先 根据 目标 闫 别 划分 数据 库 ，3 个 基本 目 
标定: 胺 、 形 状 和 纹理 








基于 内 容 的 图 像 检索 
 @ 为 什么 需要 基于 内 容 的 图 像 检索 ? 
e 和 奋 询 方式 ， 碍 询 denmo， 现 有 系统 简介 
e 有 具体 内 容 
~ 特征 提取 
~ 相似 度 匹 配 
~ 相关 反馈 
~ 索引 结构 
e MPEG-7 介 绍 : 性 能 评价 等 
e 思考 的 几 个 问题 ” 





基于 内 容 的 图 像 检 索 





e 特征 提取 (Feature Extraction) 
~ 源 色 特征 
~ 纹理 特征 
~ 形状 特征 
v 空间 关系 特征 








基于 内 容 的 图 像 检 索 


e。 汤色 特征 
~ 颜色 空间 〈 也 称 彩 色 模 型 或 彩色 系统 ) 
~ 磊 色 特征 表示 
~ 颅 色相 似 度 匹 配 算法 





上 颜 色 特 征 
e。 天 色 衬 间 








w RGB 
 CMY 或 CMYK 

w HT 

~ HSV: 比 了 榴 I 模 型 更 与 人 类 对 颜色 的 感知 


接近 
~ 均匀 凑 色 衬 间 模型 : MIM，LUV 和 Lab 








糊 色 空间 


eRB 一 >HoV 
oh 本 
2VJ(R-GJ+(R-BIG-B) 
2 克 一 arccoS R-Gi+R- 引 ) 已 > Cr 


2\VJ(R-GJ+(R-BIG- 了 B) 


S max(R,G,B)-min(R,G,B) 
max (有 R,G,B) 
7 - max( 有 尽 ,G,) 

29334 





颜色 特征 
e 均匀 颜色 空间 模型 


~ 从 图 像 处 理 的 角度 ， 对 颜色 的 摘 述 应 该 与 人 
对 凑 色 的 感知 越 搁 近 越 好 


~ 从 视觉 感知 均匀 的 角度 ， 人 上 所 感知 到 的 两 个 
颜色 的 距离 应 该 与 这 两 个 颜色 在 表达 它们 的 凑 
色 空 间 中 的 距离 越 成 比例 越 好 


~ 如 朱 在 一 个 闫 色 空 间 中 ， 人 所 观察 到 的 两 种 
颜色 的 区 别 程 度 与 该 颜色 空间 中 两 点 间 的 欧 却 
距离 对 应 ， 则 称 访 空间 为 均匀 颜色 空间 


内 型 的 例子 : MTM Luv 和 Lapb 








诱 色 特 征 


e。 上 类 色 特征 表示 
~ 统计 和 直方 贸 
~ 蒜 积 直方 图 
~ 颜色 布局 
~ 颜色 分 块 





颜色 特征 








e。 统计 直方 图 : pk)= 二 =041Z-1 


7 





糊 色 特征 
e 和 票 积 直方 图 ， 7()= > 和 K = 0,1.., 工 -1 


1 








1. 0 0. 95 





颜色 特征 

e 站 色 布局 
~ MPEG-7 中 建议 了 一 种 颜色 布局 摘 述 符 (color 
1]ayout ) 
~ 表达 颜色 的 空间 分 布 信息 

e 颅 色 布局 算法 


~ 将 图 像 从 RGB 空间 映射 到 YCbCr 空 间 : 
7 =0.299x 玉 +T0.387xGC+0.114x 吃 
CpD = -0.109x 有 -0.331xC+0.300x 孔 
C17=0.300x 尺 -0.419xG 一 0.081x 














庆 色 特征 


e 拓 色 布局 算法 
~ 将 整 副 图 像 平均 分 成 64 块 ， 计 算 每 一 块 中 所 有 
像素 各 颜色 分 量 的 平均 值 ， 以 此 作为 该 块 的 
代表 颜色 〈 主 颜色 ) 
~ 将 各 块 的 平均 值 数据 进行 DCT 变 换 
~ 通过 之 字形 扫描 和 量化 ， 取 出 3 组 颜色 DCT 变 换 
后 的 低频 分 量 ， 构 成 该 图 像 的 颜色 布局 描述 符 





庆 色 特征 


e。 拓 色 相似 度 匹 配 算法 
1 直方 多 相交 法 

2 了 欧式 距离 

3 距离 法 

4 中 心 窍 法 

5. 参考 颜色 表 读 








颜色 特征 

1、 直 方 移 相交 法 

令 也 内 和 孔 虽 9 分 别 为 查询 图 像 和 数据 库 图 像 D 
的 《〈 某 一 ) 特征 的 统计 直方 图 ， 则 两 图 像 之 间 的 
相似 信 为 


K=0 


距离 为 履 =1- PC,D) 








颜色 特征 

1]、 直 方 狗 相交 法 

如 采用 HSV 下 方 图 表示 每 幅 图 像 ， 则 两 幅 图 像 Q 和 D 
的 直方 图 交 表 示 为 : 


yy min 订 v( 感 ,S,Y) 瓦 o( 感 ,S,Y 
P(O,D)= 已 SS YV 


》 min 这 。( 瑟 ,9Y) 互 (区 ,3S,7 
2 


五 由 


二 





直方 图 相交 法 的 缺 反 : 思考 题 








Bin-By-Bin 几 “上 芝 由 
“有 “本 
ial 
而 用 站 | "和 和 
AN MY 1 > 
Bin-Across-Bin ， 、 人 二 庆 \ AS， 小 


] ANN 二 
:有 站 “ 国 | 
LE 人 1 L 天 本 机 本 SELL | 












颜色 特征 
2、 了 欧式 距离 法 





we 
和 妨 o (或 p( 动 一 0 








上 诱 色 特 征 


3、 上 距离 法 

为 减少 计算 量 ， 可 借助 直方 图 的 均值 来 粗略 地 表 
达 颜 色 人 信息。 如果 图 像 用 R，G，B 三 个 分 量 表示 ， 则 
图 像 的 特征 向量 由 这 三 个 分 量 的 均值 组 成 


三 =|muop 


此 时 图 像 Q 和 D 的 相似 值 为 


P(O.D)= -万 = Zeoswo-woj 


颜色 特征 
3、 上 距离 法 

MPEG-7 中 建议 的 项 色 布局 摘 述 符 在 匹配 时 使 用 了 
类 似 的 距离 公式 





W 为 权重 ，Yi, Cri, Cb; 为 各 个 分 量 的 第 i 个 DCT 系 数 





颜色 特征 
4、 中 心 窍 法 
对 直方 图 来 说 ， 均 值 是 其 零 阶 和 矩 ， 更 高 阶 的 矩 也 可 用 
本 了 
~ 对 一 幅 灰 度 级 为 L 的 图 像 ， 其 直方 图 为 HG) , 则 
该 图 像 的 前 三 阶 中 心 矩 分 别 为 
M ， = 2 妃 (C) 


0 





了 一 1 


M ，= 于 ( 互 ()- wo 


人 记 。 
天 一 | 


M ， = 过 ( 妃 (i )- M 让 


忆 全 





颜色 特征 
4、 中 心 矩 法 


V 对 彩色 图 像 ， 用 Mi os,MiocMiop 利 他 pp ipc; 人 io 
表示 疼 像 和 D 的 3 个 分 量 R, G, B 的 直方 图 的 ;i 


(G 委 3) 阶 中 心算 ， 则 它们 之 间 的 匹配 值 为 








3 3 3 
HQD= 队 3IMOrMN 直 开 yMrMHyMrMA 
三 人 区] 三 


如 果 彩 色 图 像 用 3 个 分 量 瑟 S, y 来 表示 ， 也 可 用 类 
似 方法 计算 








上 颜 色 特 征 
5、 参 考 颜 色 表 法 
“ 距离 法 太 粗 糙 ， 直 方 图 相交 法 计算 量 太 大 


~ 折 庄 的 方法 : 将 冬 像 颜色 用 一 组 参考 色 表 示 ， 
这 组 参考 色 应 能 复 关 视觉 上 可 感受 到 的 各 种 颜色 


~ 参考 色 的 数量 要 比 原 图 的 少 ， 可 得 徐 化 的 直方 
图 ， 所 以 匹配 的 特征 癌 量 二 


太 =| 
ri 是 第 i 种 颜色 出 现 的 频率 ，n 是 参考 颜色 表 的 尺寸 








颜色 特征 
5、 参 考 欺 色 表 法 
权 后 的 查询 独 像 和 效 据 库 多 像 D 之 间 的 匹配 值 
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基于 内 容 的 图 像 检 索 


e 纹 理 特征 
~ 概述 
~ 纹理 表示 
~ 纹理 距离 度量 举例 





基于 内 容 的 图 像 检 索 








巷 增 7 








基于 内 容 的 图 像 检 索 


e 纹 理 概 述 
~ 描述 图 像 时 第 用 的 一 个 概念 ， 类 似 于 凑 
色 ， 也 稼 取 雇 于 感知 
~ 对 纹理 的 感受 是 与 心理 效果 相 结 合 的 ， 
所 以 用 语言 或 文字 来 摘 述 纹理 很 困难 
~ 类 似 于 布 纹 、 草 地 、 砖 墙 等 重复 性 结构 
的 图 像 称 为 纹理 图 像 








基于 内 容 的 图 像 检 索 


e 纹 理 慨 述 《〈 续 ) 


7 纹理 可 认为 是 灰 度 (颜色 ) 在 空间 以 一 定 的 形式 
变化 而 产生 的 图 案 模式) 

7 一 般 来 说 ， 纹 理 图 像 中 灰 度 分 布 具有 某 种 周期 
隆 ， 即 便 灰 度 变 化 是 随机 的 ， 它 也 具有 一 定 的 统 
计 特性 

7 纹理 通常 和 图 像 频谱 中 的 高 频 分 量 是 密切 联系 
的 ， 光 滑 的 图 像 〈 主 要 包括 低频 分 量 ) 一 般 不 认 
为 是 纹理 图 像 








基于 内 容 的 图 像 检 索 


e 纹 理 表 示 
~ Tamura 表 示 法 
“ 联合 概率 十 阵 表 示 
~ 小 波 表 示 








基于 内 容 的 图 像 检 索 
Tamura 纹 理 表 示 法 





对比度、 粗细 度 和 方向 性 是 描述 纹理 的 3 
个 量 


v 利用 这 3 个 量 可 组 合成 一 个 3-D 空 间 


v 在 这 个 3 空间 中 ， 两 点 同 的 欧 陈 距离 己 
人 对 纹理 感知 的 甜 距 很 接近 


基于 内 容 的 图 像 检 索 
对 比 度 (contrast) 


~ 依赖 于 像 妹 的 灰 度 分 布 ， 它 可 训 量 疼 像 
中 局 部 的 灰 度 变化 ， 也 第 用 作对 图 像 整 体 
感知 的 一 种 搞 述 


~ 一 般 来 说 ， 图 像 的 对 比 度 与 图 像 灰 度 的 

动态 范围 及 图 像 中 边缘 的 尖锐 程度 都 有 关 
[ur /1G 小 

其 中 ，“ 是 图 像 灰 上 度 的 标准 方 震 , 4 是 图 像 灰 度 

的 4 除 中 心 定 
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基于 内 容 的 图 像 检 索 
粗细 上 度 (contfast， 也 叫 粗 糙 上 度 ) 
~ 测量 纹理 的 间隔 尺寸 /粒度 


v 与 图 像 的 分 辩 率 有 关 ， 分 状 率 大 则 纹理 
比较 狙 ， 即 组 成 纹理 的 元 隶 扩 二 比较 大 





] 
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CO0Q1Se11ES 呈 2 了 (: 让 


其 中 ， 窗 口 尺寸 是 2x25 kk 能 使 形 ! [方向 的 
> 人 7/2 最 大 化 ，k 的 取 值 在 0 到 5 之 间 





基于 内 容 的 图 像 检 索 
方 回 性 (directionality) 





v 征 一 个 全 局 的 纹理 特征 ， 它 描述 纹理 是 
如 何 治 东 些 方 癌 散 布 或 集中 的 

v 一 般 来 说， 方 同 性 与 纹理 基 元 的 形状 以 
及 如 何 将 这 些 纹理 基 元 排列 的 规则 有 天 








基于 内 容 的 图 像 检 索 


e 联 合 概率 托 阵 表示 
v 在 70 年 代 早 期 ，Haralick 等 提出 了 纹理 
特征 的 联合 概率 起 阵 表 示 。 这 种 方法 考 守 
了 纹理 在 灰 度 级 空间 中 的 相关 性 
~ 首先 基于 像素 间 的 距离 和 方 回 建立 联合 
概率 珑 阵 


~ 然后 从 联合 概率 窍 阵 中 所 取出 有 她 义 的 
统计 量 作为 纹理 描述 








基于 内 容 的 图 像 检 索 


e 小 波 表 示 
~ Smith 和 Chang 等 提出 用 小 小 子 这 的 
统计 量 〈 均 值 和 方 着 ) 作为 纹理 表示 
~ 对 112 幅 Brodatz 纹 理 图 像 的 表示 中 
达到 了 90% 的 ;准确 率 








一 些 纹理 表示 的 比较 绪 采 
e Weszka 等 比较 了 
v 傅 里 叶 能 量 谱 
~ 联合 概率 窍 阵 表 示 
v 一 次 灰 度 级 兰 分 统计 量 


e 在 地 形 梓 本 上 的 测试 表明 傅 里 时 表示 
法 的 性 能 相对 最 差 








一 些 纹理 表示 的 比较 结案 


e 0hanian 和 Dubes 比 较 了 


w 马尔 科 夫 随机 场 表 示 
~ 多 通道 滤波 需 表 示 
” 基于 分 形 的 表示 

~ 共生 矩阵 表示 


w 两 个 人 工 纹理 测试 集 《〈 分 形 ) 和 高 斯 马尔 科 夫 场 
~ 两 个 目 然 纹理 训 试 集 〈 玖 毛 和 油 凑 表面 ) 








一 些 纹理 表示 的 比较 结案 


e 结论 : 共生 矩阵 是 最 好 的 
e Ma 和 Man junath 比 较 了 
~ 正 交 和 双 正 交 小 波 变换 表示 
~ 树 结构 小 波 变换 表示 
~ Gabor 小 波 变换 表示 
~ 结论 : Gabor 小 波 变换 表示 效果 最 好 








基于 扩容 的 图 像 检 索 
e 形 状 特 征 
v 形状 单 与 目标 联系 在 一 起 ， 有 一 定 的 语 
义 沼 义 
~ 了 要 获 得 有 头目 标的 形状 参数 ， 需 要 移 对 
图 像 进 行 分 制 ， 所 以 形状 特征 的 提取 会 受 
图 像 分 割 效 末 的 影响 


~ 目标 形状 的 摘 述 是 一 个 非常 复杂 的 问 
昕 ， 人 至 今 还 没有 找到 形状 的 确切 数学 定义 








基于 扩容 的 图 像 检 索 
e 形 状 特 征 
~ 从 不 同 视 角 获 取 的 图 像 中 目标 形状 可 能 
会 有 很 大 过 别 
~ 为 崔 硝 进行 形状 匹配 ， 需 要 解决 平移 、 
矿 度 、 旋 转变 换个 变性 的 问题 








基于 内 容 的 图 像 检索 

通常 ， 形 状 表示 方法 可 分 为 两 类 
是 基于 边缘 的 形状 表示 
一 类 是 基于 区 域 的 形状 表示 


< 
| 
冰 


~ 傅 里 时 拉 述 子 : 利 用 伟 里 叶 变 换 的 边界 作为 形状 
特征 

~ 不 变 窍 朱 述 子 : 利 用 基于 区 域 的 矩 作 为 形状 特征 
~ 有 限 元 系 法 、 旗 转 函 数 、 小 波 摘 述 子 等 








基于 内 容 的 图 像 检 索 


e 基 于 形状 的 图 像 检 索 的 应 用 
~ 商标 图 像 检 索 
~ 指纹 图 像 检 索 
~ 建筑 图 纸 检 索 
~ 机 械 图 纸 检索 
~ 医学 岁 像 检 索 
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基于 内 容 的 图 像 检 索 
和 色 特 征 总 纤 


证 一 种 全 局 特征 ， 朱 述 了 图 像 或 图 像 区 域 所 对 应 景物 
的 表面 性 质 


~ 由 于 凑 色 对 图 像 或 图 像 区 域 的 方向 、 大 小 等 变化 不 敏 
感 ， 所 以 颜色 特征 不 能 很 好 地 捕捉 图 像 中 对 象 的 局 部 特 
征 
~ 颜色 直方 图 表示 的 优 缺 点 
> 优点 : 不 党 图 像 旋 转 和 平移 变化 的 影响 ， 归 一 化 可 
不 受 图 像 太 度 变 化 的 影 员 
> 缺点 : 没有 天 色 空间 分 布 的 信息 ?” 有 没有 办 法 ? 








基于 内 容 的 图 像 检 索 
纹 理 特征 总 纤 


~ 也 是 一 种 全 局 特征 ， 描 述 了 图 像 或 图 像 区 域 所 
对 应 孙 物 的 表面 性 质 

~ 仅仅 利用 纹理 特征 是 无 法 获得 高 层次 图 人 乔 内容 
~ 不 像 珊 色 特 征 基于 像 隶 点 ， 纹 理 需 要 在 包含 多 
个 像素 氮 的 区 域 中 进行 统计 计算 

~ 具有 旋转 不 变性 ， 并 且 对 于 噪声 有 较 强 的 抵抗 
能 广 








基于 内 容 的 图 像 检索 
纹 理 特征 总 结 
v 身 点 


> 当 图 像 的 分 辩 率 及 生 变化 ， 所 计算 出 来 的 纹 
理 可 能 会 有 较 六 偶 关 

可 能 受到 区 照 、 反 射 倩 况 的 影响 ， 用 于 检 款 
时 这 些 虚 假 的 纹理 会 造成 误导 


~ 可 用 于 检索 具有 粗细 、 距 密 等 方面 较 大 差别 的 
纹理 图 候 


~ 如 朱 纹 理 之 间 的 粗细 、 距 密 相差 不 大 ， 则 难于 
应 用 








基于 内 容 的 图 像 检 索 
7 可 以 有 效 利用 图 像 中 感 兴趣 的 目标 来 进行 检索 
7 存在 的 问题 ; 

> 缺乏 比较 完善 的 数学 模型 

> 如 果 目 标 有 变形 时 ， 检 索 结果 不 太 可 千 

> 仅仅 描述 了 目标 局 部 的 性 质 ， 要 全 面 描述 目 

标 常常 对 计算 时 间 和 存储 量 有 较 高 的 要 求 

> 许多 形状 特征 所 反映 的 目标 形状 信息 与 人 的 

直观 感觉 不 完全 一 致 





不 同 特征 的 相对 特 氮 
颜色 vs 纹理 


~ 珊 色 特征 充分 利用 了 图 像 的 色彩 信息 ， 而 纹理 
特征 只 利用 了 图 像 的 灰 度 信息 “〈 彩 色 纹 理 特 征 不 
多 见 ) 

~ 颜色 特征 侧重 于 图 像 整 体 信 息 的 描述 ， 而 纹理 
特征 更 偏重 于 局 部 

颜色 vs 形状 


颜色 特征 多 具有 和 平移、 旋转 和 斥 度 不 变性 ， 而 
不 少 形状 特征 《如 边缘 方向 ) 只 具有 平移 不 变性 











不 同 特征 的 相对 特 氮 
e。 纹理 vs 形状 
~ 通常 纹理 特征 比较 容易 获得 ， 而 形状 特征 的 计 
算 常 比较 复杂 

颜色 vs 形状 


” 颜色 特征 多 具有 平移 、 旋 转 和 斥 度 不 变性 ， 而 
不 少 形状 特征 《如 边缘 方向 ) 只 具有 平移 不 变性 


基于 内 容 的 图 像 检索 
@ 为 什么 需要 基于 内 容 的 图 像 检 索 ? 
e 和 奋 询 方式 ， 碍 询 demo， 现 有 系统 简介 
e 有 具体 内 容 
~ 特征 提取 
~ 相似 度 匹 配 
~ 相关 反馈 
~ 索引 结构 
e MPEG-7 介 绍 : 性 能 评价 等 
e 思考 的 儿 个 问题 ” 














相关 反馈 
为 什 女 需要 反 饮 
~ 目前 所 提取 的 描述 特征 还 不 能 完整 或 全 面 地 描 
述 图 像 的 内 容 

> 很 难说 不 同 特征 的 不 同 表达 ， 哪 种 最 好 

> 对 高 层 概念 和 视觉 感知 都 很 难 建立 有 效 模型 
人 类 不 具有 关于 底层 特征 的 全 面 知识 
~ 所 以 ， 仅 通过 一 次 检索 就 找到 需要 的 图 像 是 不 
现实 的 


~ 将 用 户 的 特殊 要 求 反 馈 给 系统 ， 以 使 榨 款 更 有 
效 且 更 接近 用 户 的 要 求 





相关 反馈 
为 什么 需要 反 饥 
“ 基于 底层 视觉 特征 的 检索 系统 带 来 的 主要 问题 
> 人 类 高 层 语义 特征 和 计算 机 底层 特征 表示 的 
政 眉 
.十 五 的 月 亮 ， 容 易 想到 颜色 、 亮 度 和 形状 
. 漂亮 的 衣服 ， 很 难 想到 颜色 、 长 短 或 尺寸 
> 人 类 视觉 感知 的 主观 性 一 一 因 人 而 蜡 
。 有 人 关注 图 像 的 区 域 色彩 而 有 人 关注 区 域 布局 
. 可 能 有 人 注重 色调 而 有 人 注重 饱和 度 








相关 反馈 
相关 反馈 的 特点 


~ 最 先 用 于 文字 检索 ， 已 有 30 多 年 的 历史 
[Rocchio 1971 





~ 利用 用 户 先前 的 检索 结 示 信息 进行 反 饿 来 目 动 
调节 当前 查询 ， 也 可 信 助 人 机 交互 细 化 用 撒 层 特 
征 表 达 的 高 层 租 询 

~ 使 用 相关 反馈 来 建立 亏 层 概念 和 展 层 特征 之 间 
的 联系 


相关 反馈 
相关 反馈 的 过 程 
“ 用 户 进行 一 次 初步 查询 ， 系 统 返回 检索 结 


~ 用 户 判断 结 琳 ， 标 记 满意 的 结 为 正 例 ， 标 记 
不 满意 的 结束 为 反例 

~ 系统 根据 用 户 标 记 结 此 进行 目 我 调整 《如 调整 
搜索 蛇 略 、 算 法 参数 、 不 同 特征 的 权重 等 ) ， 进 
行 新 一 轮 检 款 

~ 根据 用 户 有 要求， 反复 进 行 





相关 反馈 
相关 反 饿 的 研 宛 





~ 查询 点 移动 : 改进 对 理想 查询 点 的 估计 ， 有 具体 
是 将 该 得 询 点 移 同 好 的 范例 点 而 远离 坏 的 范例 点 
Rocchio 提 出 的 如 下 公 却 
0 
2 本名 夯 
其 中 oO 和 o 分 别 对 应 查询 迭代 中 第 i 次 和 第 i+1 次 
的 查询 点 位置 ， 刀 是 特征 向 量 , |D| 是 书 的 基 
数 ，re7 和 momrey 表 示 相 天文 要 和 非 相 天文 档 ， 


2x, 0 和 7 是 适当 的 参数 , 已 在 MARS 中 被 实现 








相关 反馈 
相关 反 饿 的 研 宛 


~ 册 加 权 / 调 整 权 重 : 近 遍 那些 有 助 于 检索 相关 
图 像 的 特征 的 权重 ， 同 时 降低 有 碍 于 检索 相关 图 
像 的 特征 的 权重 。MARS 系 统 实 现 了 被 称 为 标准 背 
离 方法 的 再 加 权 方 法 的 较 小 的 改进 








基于 内 容 的 图 像 检索 
 @ 为 什么 需要 基于 内 容 的 图 像 检索 ? 
e 和 奋 询 方式 ， 碍 询 denmo， 现 有 系统 简介 
e 有 具体 内 容 
~ 特征 提取 
~ 相似 度 匹 配 
~ 相关 反馈 
~ 索引 结构 
e MPEG-7 介 绍 : 性 能 评价 等 
e 思考 的 几 个 问题 ” 








基于 内 容 的 图 像 检 索 


e 为 什么 需要 款 引 结构 ? 
~ 海量 的 图 像 内 容 
~ 图 像 检 索 的 速度 要 求 
e 可 用 的 系 引 结构 


~ 满足 距离 定义 的 和 票 引 结构 ， 如 使 用 欧 陈 距离 
度量 多 和 像 的 相似 度 


~ 距离 的 定义 





基于 内 容 的 图 像 检 索 


~ 距离 的 定义 《〈 续 ) : 
人 
(2) qd(x,X) = 0 
G) 0《 d(Gx y) 《 ce，X 天 y 
由 dy) 和 dx2) + dz,y) (三 角 不 等 式 ) 


疼 像 相似 度 的 实际 情况 
~” 挑 成 性 问题 


如 何 莱 顾 检索 正确 性 和 速度 的 要 求 ， 研 稳 图 像 检索 的 
系 引 结构 〈 包 括 视频 镜头 和 视频 片断 的 索引 结构 ) 





基于 内 容 的 图 像 检索 
 @ 为 什么 需要 基于 内 容 的 图 像 检 索 ? 
e 和 奋 询 方式 ， 碍 询 demo， 现 有 系统 简介 
e 具体 内 容 
~ 特征 提取 
~ 相似 度 匹 配 
~ 相关 反馈 
~ 索引 结构 
e MPEG-7 介 绍 : 性 能 评价 等 


@ 思考 的 几 个 问题 。 








基于 内 容 的 图 像 检索 
MPEG-7 





~ Multimnedia Content Description [Interface， 


多 群体 内 容 拉 述 接口 
~ 包括 静止 图 像 、 运 动 图 像 、 计 算 机 图 形 、32 


模型 、 动 国 、 语 言 、 声 音 等 

~ 建立 对 不 同 多 允 体 信息 〈 主 要 为 音频 视频 ) 的 
标准 描述 〈 包 括 指定 一 组 摘 述 符 和 描述 方案 ) 

~ 仅仅 是 朱 述 有 关内 容 的 信息 ， 但 并 不 是 内 容 本 
刁 








基于 内 容 的 图 像 检 索 

e MPEG-7 标 准 的 4 个 特点 
~ 通用 : 能 够 摘 述 各 种 应 用 环境 的 多 媒体 内 容 
~ 基于 目标 的 数据 模型 : 能 够 分 别 描述 单个 目 
标 ， 如 场景 和 场景 中 的 目标 

~ 集成 : 将 底层 的 特征 和 高 层 的 摘 述 集成 到 同一 
个 结构 中 ， 结 合 了 它们 的 摘 述 能 广 

~ 可 扩展 : 摘 述 定义 语言 保证 了 可 将 MPEG-7 标 准 
扩展 到 新 的 应 用 领域 ， 满 足 新 的 需求 并 集成 新 的 
摘 述 工具 





基于 内 容 的 图 像 检 索 











基于 内 容 的 图 像 检 索 


e MPEG-7 不 包括 特征 提取 的 工具 和 算法 ， 也 不 包 
括 搜 索引 擎 


e 让 产业 界 开展 竞争 ， 以 得 出 最 好 的 末 


e MPEG-7 仅 仅 标 准 化 内 容 摘 述 工 具 ， 而 将 内 容 分 
析 工 具 〈 如 特征 提取 ) 和 内 容 使 用 工具 〈 如 搜索 
引擎 和 内 容 过 滤 ) 交 给 产业 界 

e 仅仅 将 对 多 媒体 描述 的 格式 〈 包 括 句法 和 话 
义 ) 归于 需要 规范 的 部 分 ， 而 将 其 它 归 于 非 规范 
的 部 分 








MPEG-7 对 试验 的 性 能 评价 

e@ ANMRR (Average Normalized Modified 
Retrieval Rank) ， 平 均 归 一 化 调整 后 的 检索 秩 
e@ AR (Avetfage Recal1 ) 

e 4R,4MMRR < |0,1| 

e AR 信 越 高 ， 往 全 性 能 越 好 


e ANMRR 信 越 低 ， 碍 准 性 能 越 好 ， 明 更 多 正确 的 
结束 排 在 前 面 








MPEG-7 对 试验 的 性 能 评价 


e 首先 挑选 出 一 个 查询 图 像 的 集合 和 & ， 对 每 个 碍 询 
图 像 主 观 地 选取 一 组 视觉 相似 的 图 像 作 为 标准 ， 
正确 答案 (Ground Truth) 

e 议 奉 询 独 像 o 的 相似 图 像 的 个 数 为 ng (ao 。 对 于 

丛 询 图 像 "， 检 有 系 结 果 的 规 断 值 4 宦 义 为 
minl4xs(,2xGZ, 其 中 ，CIJ 帮 在 所 有 查询 图 像 中 
最 大 的 相似 图 像 个 数 ， 即 CINEzaxr{lzg(c) 

e 对 于 查询 图 像 "， 在 前 4 休 检 索 结果 中 正确 的 个 


数 记 为 ar (wo， 漏 挥 的 个 数 记 为 W(a]) pg(o/- 
Ar(9)/。 奉 全 率 记 为 P(a) Dr(o) Ag (9 








MPEG-7 对 试验 的 性 能 评价 
e 每 个 正确 答案 在 检索 结果 中 都 有 一 个 秩 
Lamp)7C)，7=1 058(o0。 在 站 检索 结果 
中 ， 正 确 的 图 像 的 秩 z( 人 (27 就 是 它 的 序号 ， 其 余 被 
漏 掉 的 图 像 的 秩 zC) 都 设 定 为 K+1 

e 对 于 某 个 查询 网 像 "， 它 的 平均 检索 秩 和 调整 后 
的 检索 秩 分 别 定 义 为 











MPEG-7 对 试验 的 性 能 评价 OO 
e 将 WE81(o) 归 一 化 至 [0, 可 范围 内 ， 得 到 归 一 化 调 
整 后 的 检索 秩 MVNR (9/: 


NMRR(OD = 2AA(9) 


开 一 28 人 +035 


e 对 6 中 所 有 的 得 询 图 像 o 的 NU 和 (co) 作 
平均 ， 得 到 4NWURR4A: 


O 
4NAMRR = NAMRR(O) 
9d=1| 


1] 2 
4R 尺 = 尺 (Cg) 








MPEG-7 对 试验 的 性 能 评价 


。AR 与 ANMRR 说 明 


~ 不 仅 适 用 于 评价 匈 像 ， 也 运用 于 镜头 、 广 
断 、 文 本 检 款 

~ 不 能 计算 “哪个 更 像 ”， 只 能 统计 正确 结果 的 
顺序 








基于 内 容 的 图 像 检 索 


e 为 什么 需要 基于 内 容 的 图 像 检 索 ? 
e 和 奋 询 方式 ， 碍 询 demo， 现 有 系统 简介 
e 有 具体 内 容 

~ 特征 提取 

~ 相似 度 匹 配 

~ 相关 反馈 
e MPEG-7 介 绍 : 性 能 评价 等 
e 于 考 的 几 个 问题 ? 





思考 的 几 个 问题 
1， 基 于 查询 例子 的 检索 是 好 的 吗 ? 查询 图 像 
从 何 而 来 ? 如 何 用 于 搜索 引擎 ? 


光 豆 ires 一 看 icroso 于 廿 Imterme 二 王 三 DP1Lo 基 ee 工 


立 件 严 ) ”编辑 严 ) 查看 0 收藏 纪 工具 GC) ”帮助 00D 


四 三 -加 - 因 国 约 | 忆 页 sx se 号 





























后 了 Wimndows Exc- 










思考 的 几 个 问题 人 
如 何 解决 人 类 高 层 语义 和 计算 机 底层 特征 表 
示 的 矛盾 ?如何 实现 语义 检索 7 中 间 层 ? 








天 全 
专利 
1 


5 斌 天 宙 | 


关上 妇 吝 

骨 。 人 
:六 

4 兴 必 全 册 | 





思考 的 几 个 问题 
;， 个 人 巾 片 如 何 管理 和 索引 ? 数码 相机 ，,，. 


V 地 点 : 








在 西藏 的 ? 在 香港 的 ? 


: 父母 的 ? 女 朋 友 的 ? 
: 2004 年 五 一 的 ? 小 时 候 的 照 户 ? 
: 泰山 ? 黄果树 漂 布 ? 








思考 的 几 个 问题 


主要 参考 文献 : 


章 艇 晋 ， 基 于 内 容 的 视觉 信息 检索 ， 科 
学 出 版 社 ，2003 年 。 








数字 图 像 处 理 〈4) 


任何 问题 ? 
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傅 里 叶 变 换 


e。 伟 里 时 变换 
~ 傅 里 时 变换 及 其 反 变 换 
“ 傅 里 时 变换 的 性 质 
~ 快速 人 埔里 时 变换 〈FEFT ) 





傅 里 叶 变 换 
。 为 什么 要 在 频率 域 研究 狗 像 增强 


v 可 以 利用 频率 成 分 和 图 像 外 表 之 间 的 对 应 关系 。 一 
些 在 空间 域 表述 困难 的 增强 任务 ， 在 频率 域 中 变 得 非 
常 普通 

7 滤波 在 频率 域 更 为 直观 ， 它 可 以 解释 空间 域 滤波 的 
某 些 性 质 

”可 以 在 频率 域 指定 滤波 器 ， 做 反 变换 ， 然 后 在 空间 
域 使 用 结果 滤波 器 作为 空间 域 滤波 器 的 指导 

“一 旦 通过 频率 域 试验 选择 了 空间 滤波 ， 通 常 实施 都 在 
空间 域 进行 











傅 里 叶 变 换 





。 一 维 连续 傅 里 叶 变换 及 反 变 换 
ee Go 的 傅 里 时 变换 Fu) 定义 
而 | OoerPaadx 
其 中 ，7= V-1 
~ 给 定 F(u) ,通过 傅 里 时 反 变 换 可 以 得 到 f(x) 
人 | Faoeprea 








傅 里 时 变换 


e 二 维 连续 傅 里 时 变换 及 反 变 换 
~ 二 维 连续 函数 f(x, y) 的 傅 里 时 变换 Fu, v) 定 
义 为 网 
天 (= | | FFCc ye 2zlorrmy Joe7y 
v 给 定 F(u v), 通过 传 里 叶 反 变换 可 以 得 到 
下 人 (X，y) 


FF 让)= | | FL TV)e7 2z(ertmyjao1y 





傅 里 时 变换 





e。 一 维 离散 傅 里 时 变换 (DFT 及 反 变 换 
~ 单 变 量 离散 函数 f(x) (x=0, 1 2, . . ,M-1) 的 传 
里 叶 变换 Fa) 定义 为 

天 (2) = 王 区 


=(0 


u=0, 1 2, .NMC1 
~ 给 定 F(u ,通过 傅 里 时 反 变 换 可 以 得 到 f(x) 
1 = 六 FJeperx 
x=0, 1 2 ,NT 





傅 里 时 变换 





e。 一 维 离散 传 里 时 变换 及 反 变 换 


v 从 欧 拉 公式 ej/ =cosg+ jsing 


天 (CO) 二 了 


F(xzjlcos(-27mitxz)/M + jsin(-27zm0)1M ) 


了 (xjcos 270XN1L4 -JSIn27TC1ALI ) 








傅 里 时 变换 
e 傅 里 时 变换 的 极 坐标 表示 
FU-Fojema 
7 幅度 或 频率 谱 为 
FOj- [opP + 
Ru) 和 I(u) 分 别 是 F(u) 的 实 部 和 虚 部 
w 相 角 或 相位 谐 为 


j0)- aa 机 | 











传 里 叶 变 换 
e 传 里 时 变换 的 极 坐标 表示 
v 功率 谱 为 
Pg=|Fe =Rey +7 
e fx) 的 离散 表示 
Flxz)s 和 x+xAr) xx=012,M -1 


e Fu) 的 离散 表示 
Fe)= 下 (CeAz) =012.M-1 





傅 里 叶 变换 
。 二 维 离散 传 里 叶 变换 及 反 变 换 
~ 图 像 尺 寸 为 MXN 的 图 数 fx, y) 的 DFT 为 
Fe,y)= Ti 
U=0U, 1 2，...，M-1， Vv=U, 1 2，...,N-1 
v 给 出 F(u v), 可 通过 反 DFT 得 到 f(x, y)， 
-和 呈 Ceatenremn 
RISE 
注 ，u 和 v 是 频率 变量 ，x 和 y 是 空间 或 图 像 变量 








傅 里 时 变换 


e 二 维 DFT 的 极 坐标 表示 
(=|Foyjewe 
~ 幅度 或 频率 谱 为 
Fe = [Re 让 二 re 
Ru vv 和 Tu v 分 别 是 Fu v 的 实 部 和 虚 部 
相 角 或 相位 谱 为 
二 ac 








傅 里 叶 变 换 


e 二 维 DFT 的 极 坐 标 表 示 
7 功率 谱 为 
Pu y 二 焉 tu 中 恒 RD 直 十 7 ( 相 


e。 Fu v) 的 原点 变换 


SrGsy)CnD5 =FG-My2v-N12) 


~ 用 (Day 乘 以 f(x y) ,将 F(u, v) 原点 变换 到 频 
率 坐 标 下 的 (M2，N/2)， 它 是 MXN 区 域 的 中 心 


w U=0U, , 2，...，M-1， Vv=U, 1 2，...,N-1 








傅 里 时 变换 


e。F(0, 0) 才 示 


1 AM -1N-=-! 


FOO)- 庆 宇 守 7Go) 
这 说 明 : 假 议 fx 7 是 一 幅 图 像 ， 在 原 氮 的 傅 
里 叶 变 换 等 于 图 像 的 平均 灵 度 级 








傅 里 时 变换 


e 如 采 f(x, 7) 是 实 函 数 ， 它 的 传 里 叶 变 换 是 
对 称 的 ， 即 

三 (5 y) 一 有 人 (- 1, 一 V) 
e。 传 里 时 变换 的 频率 谐 是 对 称 的 

下 (u yj 攻 下 (一 一 








傅 里 叶 变 换 


e。 伟 里 时 变换 
~ 傅 里 时 变换 及 其 反 变 换 
~ 傅 里 时 变换 的 性 质 
~ 快速 人 埔里 时 变换 〈FEFT ) 








傅 里 叶 变 换 
e 维 傅 和 主 盯 人 笠 j 性 质 
1 平移 性 质 





2 分配 律 

3 尺度 变换 《缩放 ) 

4 旋转 性 

5 周期 性 和 共 斩 对 称 性 
6. “平均 值 

7 可 分 性 

8 郑 积 





9. ”相关 性 





W 


W 


W 


傅 里 叶 变 换 
傅 时 朋 变换 鸡 的 平 移 性 质 
以 全 表示 图 数 和 其 傅 里 时 变换 的 对 应 性 





FF yje IOX/AAMAHWY/AN) 他 FU 下 ,一 攻 ) (]) 
jy 莽 Fom 
公 却 〈1) 表明 将 fx, y) 与 一 个 指数 项 相 乘 就 相当 于 
把 其 变换 后 的 频 域 中 心 移动 到 新 的 位 置 
公式 〈2) 表明 将 F(tu, v) 与 一 个 指数 项 相 乘 束 相 当 于 
把 其 变换 后 的 空域 中 心 移动 到 新 的 位 置 
公式 〈2) 表明 对 f(x, y) 的 平移 不 影响 其 传 里 时 变换 
的 幅 值 











傅 里 叶 变 换 
1 传 里 时 变换 对 的 平移 性 质 〈 续 ) 
当 uu=M/2 且 vo=N/2， 


B 7J2z(wx/AMAHwy/AN) 二 JZCCHy) 二 1 


带 入 (1) 和 (2) ， 得 到 
Flxyl-Um7 亿 FM/12v 一 N/I) 
Frx-M12y-NI 人 EVD 





傅 里 叶 变 换 
2， 分 配 律 
根据 傅 里 时 变换 的 定义 ， 可 以 得 到 





SAoo y)+ 户 ay=SLAhGcyHSLPec 


Seooyje 户 ooyjz=SlAooyjeslPocy) 


上 述 公 却 衣 明 : 傅 里 时 变换 对 加 法 满足 分 配 
侍 ， 但 对 乘法 则 不 满足 





傅 里 叶 变 换 





3， 尺 上 变 换 〈 缩 放 ) 
给 定 2 个 标量 a 和 bp， 可 以 证 明 对 傅 里 时 变换 下 列 


2 个 公式 成 立 
ar (x， y) 人 人心 aF (zy 


Fax,py) 作 
人 








傅 里 叶 变 换 
4 旋 园 性 
引入 极 坐 标 X=7rcos&y=7SIinCU=CcosDVY=OSlnm 
将 fx y) 和 Fu V) 转换 为 fg 和 ELwJ。 将 它 
们 市 入 傅 里 叶 变 换 对 得 到 
Fr,O+0) 人 Fo,p+O 


~ ，f(x, y) 旋 转角 度 %，F(u v) 也 将 转 过 相同 
的 角度 


“ Fu 旋 转角 上 度 和 ，fktx 7 也 将 转 过 相同 
的 角度 





传 里 叶 变 换 
5. 周期 性 和 共 斩 对 称 性 
(yy)= 开 U+M =FUy+N)= 开 +M +NI 
Flxy)= Flxz+M,y)= pxy+N)=Fx+M,y+N 
上 上述 公 却 表 明 
~“ 尽管 F(u v) 对 无 穷 多 个 u 和 v 的 值 重复 出 现 ， 但 只 需 
根据 在 任 一 个 周期 里 的 N 个 值 承 可 以 从 F(u, v) 得 到 
f (xy) 
“ 只 需 一 个 周期 里 的 变换 束 可 将 Fu, v) 在 域 里 完全 


硝 定 
~ 同样 的 结论 对 f(x, y) 在 空域 也 成 立 








传 里 时 变换 
5 周期 性 和 共 恩 对 称 性 


如 采 f(x, Z 是 实 图 数 ， 则 它 的 傅 里 时 变换 具有 
共 恩 对称 性 


已 (zy)= 严 "( 一 1 一) 
(esyj 性 下 ( 一 到 = 
其 中 ，F*(u v) 为 Fu v) 的 复 共 恩 。 


e 复习 : 当 两 个 复数 实 部 相等 , 虚 部 互 为 相反 数 时 , 这 两 个 
复数 叫做 互 为 共 斩 复 数 . 





周期 性 和 共 板 对 称 性 举例 


e 对 于 一 维 变换 Fu) ， 周 期 性 是 指 F(u) 的 周期 长 
度 为 NM， 对 称 性 是 指 频 谱 关 于 原点 对 称 
半 周 期 的 传 里 叶 频 谱 ~ 全 周期 的 伟 里 时 频谱 
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FIGURE 4.34 

(a) Fourier Rs CT 罗 ER 
spectrum showing -MP 0 2 0 对 忆 M-1 
back-to-back hk 一 Oncperiod 一 一 | hk- one period 一 一 | 


half periods im 

the interval 

[0, M - 1. 

(b) Shifted 

spectrum Showing 

afullperiod in the 

same interval. 

(c) Fourier 

spectrum of an 

imase,showing the 

same back-to-back 

Properties as (3)、， 

but in two 

dimensions. 

(d) Centered 

Fourier spectrum. | | 
下 


一 幅 二 维 图 像 的 传 里 叶 频 谱 中心 化 的 傅 里 时 频谱 








傅 里 叶 变 换 


[要 
1] 二 Pa 去 27my/N 
(= 一 CC 7/ 人 一 》 太 (x， yje ICVYy 
LI 
X=(0 y=0 
1 上 -| 
LI 


一 172 /AAA 
攻 已 (xy 


沾 
上 由 


F(x, v) 是 沿 着 f (x, y) 的 一 行 所 进行 的 传 里 叶 变 
换 。 当 x=0, 1, .Mr-1， 沿 着 f(x, y) 的 所 有 行 计 
算 传 里 叶 变 换 。 








傅 里 时 变换 
56. 分离 性 一 一 二 维 传 里 时 变换 的 全 过 程 


FIGURE 4.35 
Computation of 
the 2-D Fourier 
transform as 3 
Series of 1-D 
transforms. 





TOW column 
transforms transforms 


“ 和 爷 通 过 治 输入 图 像 的 每 一 行 计 算 一 维 变换 

~ 和 再 治 中 间 结 条 的 每 一 列 计 算 一 维 变 换 

“ 可 以 改变 上 述 顺序 ， 即 移 列 后 行 

上 述 相似 的 过 程 也 可 以 计算 二 维 传 里 时 反 变 换 








傅 里 叶 变 换 
7， 平 均值 
由 二 维 傅 里 叶 变 换 的 定义 


1 M -LN=-l 
已 (uv)= 三 太 (x， 人 
人 X=0 y=(0 
) 1 采 =]N=l ( ) 
P 人 0.0 一 一 太 X,，y 
所 以 二 2 之 








傅 里 时 变换 
7 平均 信 
所 以 


Fo y)= 下 (0.0) 


上 式 说 明 ; 如 果 f(x, y) 是 一 幅 图 像 ， 在 
原点 的 傅 里 时 变换 即 等 于 图 像 的 平均 灰 度 
级 








傅 里 叶 变 换 
8 和 卷 积 理论 


大 小 为 MXN 的 两 个 函数 ftx, y) 和 h(x, y) 的 离散 
耸 积 


jz 二 Fa 


丰 (zx yjJnlx 了) < 人 太 ( 昌 # 三 ( y) 











傅 里 时 变换 
9 相关 性 理论 


大 小 MXN 的 两 个 函数 fx y) 和 htx, y) 的 相关 
性 定义 为 RE 
(xy)o7 0 jx 十 7, y 十 刀 ) 


们 表示 f 的 复 共 斩 。 对 于 实 函 效 ， 区 一 荆 


相关 定理 
人 下 (x y)oHlz y 人 包 ya y 


丰 人 yj 7y] 全 人 (& y) o 孔 包 y) 








傅 里 叶 变 换 
。 自 相关 理论 
jjejeeFei =ReTH 人 人 


Fe 中 他 FoyjoFlzy 


注 : 复数 和 和 它 的 复 共 白 的 乘积 是 复数 模 的 平方 








传 里 时 变换 
。 疮 可 和 相关 性 理论 总 结 
~ 卷 积 是 空间 域 过 滤 和 频率 域 过 滤 之 间 的 纽带 


~ 相关 的 重要 应 用 在 于 匹配 : 确定 是 售 有 感 兴 
趣 的 物体 区 城 


> fx y) 征 原始 图 像 
> hx 7) 作 为 感 兴趣 的 物体 或 区 域 〈 模 板 ) 


> 如 打 匹 配 ， 两 个 函数 的 相关 值 会 在 h 找 到 f 
中 相应 点 的 位 置 上 达到 最 大 











相关 性 匹配 举例 
网 你 fy 模板 h(x,y) 


a hb 
中 到 
e 

FIGURE 4.41 


【a) Imase. 
区 图 (bj Template. 
| 下 K fc) and 


RS 
(e) Correlation 
本 tion dis SPlaye d 
s an image 
人 Horizontal 
Profle line 
也 rough the 
1 Value in 
(ej.showing the 
px cint at which the 
best match took 
Place. 


延 拓 图 像 hx, y) 





Highestec 
Wal 





通过 相关 图 像 最 大 
sis 值 的 水 平 灰 度 剖面 图 


相关 函数 图 像 








傅 里 叶 变 换 


e。 伟 里 时 变换 
傅 里 时 变换 及 其 反 变 换 
~ 傅 里 时 变换 的 性 质 
~ 快速 傅 里 叶 变 换 (FFT, 


> 只 考虑 一 维 的 情况 ， 根 据 傅 里 时 变 
换 的 分 离 性 可 知 ， 二 维 传 里 叶 变 换 可 
由 连续 2 次 一 维 傅 里 时 变换 得 到 





快速 传 里 叶 变 换 (FFT) 
。 为 什么 需要 忆 速 传 里 时 变换 ? 


1 LI 一 
忆 2 (je 012..M -1 
X=0 





” 对 u 的 M 个 信 中 的 每 一 个 都 需 进 行 M 次 复数 乘法 (将 f(x) 
与 exew% 相 乘 ) 和 MI 次 加 法 ， 即 复数 乘法 和 加 法 的 次 
数 都 正比 于 M2 


~ 快速 传 里 叶 变 换 人 FFT) 则 只 需要 Mlog>M 次 运 企 


~ FFT 算 法 与 原始 变换 算法 的 计算 量 之 比 是 log.M/M， 如 
M=1024s103, 则 原始 变换 算法 需要 106 次 计算 ， 而 FFT 需 
要 104 次 计算 ，FFT 与 原始 变换 算法 之 比 是 1: 100 








快速 传 里 叶 变 换 FFT) 


e FFT 算 法 基本 思想 
FFT 算 法 基于 一 个 叫做 逐次 加 倍 的 方法 。 通 
过 推导 将 原始 傅 里 时 转换 成 两 个 递 推 公 丈 








快速 传 里 叶 变 换 (FEFT) 


e FFT 算 法 基本 思想 
F(O= 区。 ee(OB L = 0 .2 4 | 
] 
民 (oz 二 及) 宣 | 二 (g- Li (| 


其 中 : M = 和 
F (oO) 、F Co) 是 K 个 点 的 傅 里 叶 值 








快速 传 里 叶 变 换 (FEFT) 


。FFT 公 式 推导 
FFT 算 法 基于 一 个 叫做 逐次 加 倍 的 方法 。 为 
方便 起 见 用 下 式 表达 离散 传 立 叶 变换 公式 


= 六 ee 








快速 传 里 叶 变 换 (FEFT) 


假 衣 M 的 形 却 十 
M =2 
n 为 正 整数 。 因 此 ，MH 以 表示 为 


1M=2K 
将 M= 和 K 屯 入 上 却 


天 一 | 天 一 | 


] ] ZX ] ZX 十 
-人 TO TCrra 


X=0 








快速 传 里 叶 变 换 (FEFT) 


一 1271AI 


所 以 


2 -ij2r(2oo)/2K -1j12r000/ 有 KR 
了 二 ee IX 本 = 机 六 
带 入 上 式 有 


Fr 的 = 了 于 光 /Pet 人 /eraen | 








快速 传 里 叶 变 换 (FFT) 


1 太一 
书 ， (4 -去 之 / FFC2xj 位 0 一 UL2...K 一 ] 








快速 传 里 叶 变 换 (FFT) 


得 到 FFT 的 第 一 个 公元 
_ 
S 民 已 人 ) 人 | zj 了 2 ] 


该 公 式 说 明 F(u 可 以 通过 奇 部 和 倡 部 之 和 
来 计算 








快速 传 里 叶 变 换 (FFT) 





推导 : 一 2727C0HK)/K 
一 127PL/K 一 12 
二 7J27L]/ BC J2 克 
& 1 克 本 帮 (人 矿 
= 机 :er = 全 :人 ( 下 = 厂 ; 
人 全 一 -7J2z(+KJN2K 
2K 


-j27zV2K 一 7 
三 2 3 


一 媳 2ke We WA2x 一 ID 一 一 Wok 





快速 传 里 叶 变 换 (FFT) 








1 去 1 十 X 1 < 1 十 玉 儿 2X 十 
F(2xzjJw KJ(2z) ， Te 开 )(2 加 


X=-0 X=0 








快速 传 里 叶 变 换 (FFT) 


得 到 FFT 的 第 二 个 公式 





该 公 丈 说 明 FGu 十 蕊 可 以 通过 奇 部 和 倡 部 之 
天 来 计算 








快速 传 里 叶 变 换 (FFT) 


e。 了 节 后 得 到 FFT 的 二 个 公 却 


要 S 民 已 人 ) 人 | 芳 ) 取 交 | 








快速 传 里 叶 变 换 FFT) 


e 分 析 这 些 表 达 陈 得 到 如 下 一 些 有 趣 的 特性 : 
一 个 M 个 点 的 变换 ， 能 够 通过 将 原始 表达 
却 分 成 两 个 部 分 来 计算 
w 通过 计算 两 个 〈M/2) 个 点 的 变换 。 得 
Fevenku) 和 Foaaku) 

w 柯 部 与 俏 部 之 和 得 到 F(u) 的 前 QWV2) 个 值 
柯 部 与 偶 部 之 差 得 到 F(u) 的 后 (MX2) 个 
值 。 且 不 需要 笑 外 的 变换 计算 








快速 传 里 叶 变 换 (FFT) 


e 上 纳 快速 傅立叶 变换 的 思想 : 
(1) 通过 计算 两 个 单 点 的 DFT， 来 计算 两 个 
点 的 DFT， 
(2) 通过 计算 两 个 双 点 的 DFT， 来 计算 四 个 
点 的 DFT，...， 以 此 类 推 


(3 ) 对 于 任何 - 2" 的 DFT 的 计算 ， 通 过 计算 
两 个 NMX2 点 的 DFT， 来 计算 N 个 点 的 DFT 








快速 传 里 叶 变 换 (FFT) 


e FFT 算 法 基本 思想 
FFT 算 法 举例 : 
设 : 有 了 困 数 fx ， 其 N = 23 = 8, 有 : 
tf(0),f(),f(2),f(3),f(4),f(5),f(6),f(7)] 
计算 ; 
{F(0),F(GD,F(2),F(3),F(4),F(5),F(6),F(7) 】 








快速 传 里 叶 变 换 (FFT) 


e FFT 算 法 举例 
首先 分 成 柯 信 两 组 : 
有 : {f(0)，f(2)，f(4)，f(6) } 
{f(D)，f(3)，f(5)，f(7) 


为 了 利用 递 推 迁 性 ， 再 分 成 两 组 : 
有 : 1{fO，f(4)  ，{f(2)，f(6) 】 
(LEfUDD，f(5) 上 ， (EGG3)，EG7) | 








快速 传 里 叶 变 换 (FFT) 
e FFT 算 法 实现 
~ 对 得 入 数据 的 排序 可 根据 一 个 简单 的 位 对 换 
规则 进行 
> 如 用 x 表 示 f(xz) 的 1 个 目 变 量 值 ， 那 么 它 排 序 后 对 应 
的 值 可 通过 把 x 表 示 成 二 进 制 数 并 对 换 各 位 得 到 
> 例如 N=23, f(6) 排 序 后 为 f(3), 因为 6 二 110; 而 011， 
二 
~ 把 得 入 数据 进行 了 重新 排序 ， 则 输出 结 末 是 
正确 的 次 序 。 反 之 不 把 输入 数据 进行 排序 ， 册 
箱 出 结 采 需要 重新 排序 才能 得 到 正确 的 次 序 





快速 传 里 叶 变 换 (FEFT) 


e FFT 算 法 实现 
地 址 的 排序 : 一 一 按 位 倒序 规则 
例如 : 由 宇 2 








原 地 址 原 顺 序 新 地 址 新 顺序 
000 f(0) 000 f(0) 
001 | 100 人 
010 0 010 2) 
011 | 110 f(6) 
100 和 人 001 | 
101 f(5) 101 二 
110 下 | 011 下 


111 和 人 1 1 








快速 传 里 叶 变 换 (FEFT) 








e FFT 算 法 实现 几 个 关键 点 
2) 计算 顺序 及 地 址 增 量 : 2 mn = 0,12... 
地 址 +1 地 址 +2 地 址 +4 
f(0) ee (0) F (0) 一 一 
f(4) P 村 Fi (4) 
| FL) 商人 
f(6) F, (6) F, (6) 
JI FU 局 (LU 
f(5) 元 滑 包 
| 3) | 


下 (7) 局) 民 








数字 图 像 处 理 〈5) 


任何 问题 ? 
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频率 域 图 像 增强 


e 频率 工 滤波 
e。 频率 域 平滑 〈 低 通 ) 滤波 器 
e。 频率 域 锐 化 《高通 ) 滤波 器 





频率 域 图 像 增强 


。 为 什么 要 在 频率 域 研究 狗 像 增强 


~ 可 以 利用 频率 成 分 和 图 像 外 表 之 间 的 对 应 关系 。 一 
些 在 空间 域 表述 困难 的 增强 任务 ， 在 频率 域 中 变 得 非 
常 普通 

滤波 在 频率 域 更 为 直观 ， 它 可 以 解释 空间 域 滤波 的 
某 些 性 质 

7 给 出 一 个 问题 ， 寻 找 某 个 滤波 器 解决 该 问题 ， 频 率 
域 处 理 对 于 试验 、 迅 速 而 全 面 地 控制 滤波 器 参数 是 一 
个 理想 工具 

7 一 旦 找到 一 个 特殊 应 用 的 滤波 器 ， 通 常 在 空间 域 采 
用 硬件 实现 它 














频率 域 图 像 增强 


e 傅 里 时 变换 的 频率 分 量 和 图 像 空 = 间 特 征 
之 轩 的 联系 
~ 变化 最 慢 的 频率 成 分 (u=v=0) 对 应 一 幅 网 像 
的 平均 灰 度 级 


1] AM -1N-=-1 


人 )= ax, y) 


当 








上 
8 SS 

频率 域 沽 波 AN 
了 


e 信里 叶 变 换 的 频率 分 量 和 疼 像 衬 间 特征 
之 间 的 联系 〈 续 ) 
~ 当 从 变换 的 原点 移 开 时 ， 低 频 对 应 痢 图 像 的 
慢 变 化 分 量 ， 如 图 像 的 平滑 部 分 
~ 进一步 离开 原点 时 ， 较 高 的 频率 对 应 图 像 中 
变化 越 来 越 快 的 灰 度 级 ， 如 边缘 或 噪声 等 尖 铅 


部 分 








1 用 CDz 乘 以 输入 图 像 进行 中 心 变换 
Flxyl-U7 亿 Flu-M12v 一 N/I) 

2， 计 算 1 中 的 DFT Fu, v) 

3， 用 滤波 需 图 数 Hu, w) 乘 以 Fu, v) 

4 计算 3 中 结果 的 反 DFT 

5 得 到 4 中 绪 果 的 实 部 

6. 用 (Dr 和 滋 以 5 中 的 结果 ， 取 消 输 入 图 像 的 
乘 数 





频率 域 滤 疲 


e 频 潍 域 滤 小 Gy = 豆 wyEey 

~ H 和 F 的 相 乘 在 逐 元 如 的 基础 上 和 定 义 ， 即 了 的 
第 一 个 元 辫 乘 以 F 的 第 一 个 元 际 ，H 的 第 二 个 
元 素 滋 以 F 的 第 二 个 元 素 

一 般 ，F 的 元 素 为 复数 ，H 的 元 素 为 实数 

了 为 零 相 移 滤波 器 ， 因 为 滤波 器 不 改变 变换 
的 相位 ，F 中 实 部 和 虚 部 的 滋 数 (H) 可 以 抵消 


相 角 Wanl | 





频率 域 滤 疲 


。 示 率 城 滤 六 的 基本 步 又 


Frequency domain filtering Operation 











F(x, y) 3 y) 


Input Enhanced 
image imape 


FIGURE 4.5 Basic steps for fltering in the frequency domain. 


电 想 : 通过 尖 波 硕 图 数 以 东 种 方式 来 修改 镜像 
变换 ， 然 后 通过 取 绪 桌 的 反 变 换 来 狄 得 处 理 后 
的 输出 图 像 





频率 域 滤 疲 


e。 一 些 基 本 的 滤 流 郝 : 如 何 作 用 于 图 像 ? 
” 陷 六 滤波 人 夷 

“ 低 通 《 平 请 ) 小 站 人 郁 

” 局 通 〈 锐 化 ) 滤波 船 





e 陷 流 滤波 需 


媚 (wy)= 





0 (uv=(MA2,NX2) 

1 其 它 

“ 设置 F\0, 0) =0( 结 果 图 像 的 平均 值 为 零 ) ， 而 
保留 其 它 傅 里 时 变换 的 频率 成 分 不 变 


” 除了 诛 点 处 有 凹陷 外 ， 其 它 均 是 音量 函数 

“ 由 于 图 像 平均 值 为 0 而 产生 整体 平均 灰 度 级 
的 降低 

“ 用 于 识别 由 特定 的 、 局 部 化 频 域 成 分 引起 的 
空间 铬 像 效 末 





陷 波 滤 流 和 举 例 


图 陷 波 滤波 器 


一 人 > 





由 于 图 像 平 均值 为 0 而 产生 整体 平均 灰 度 级 
的 降低 








， 
频率 域 滤波 人 








氏 通 滤波 货 : 使 低频 通过 而 使 局 频 腥 减 的 泪 肖 


局 


一 人 、 


| 


“ 和 梓 低 通 滤波 的 图 像 比 原 始 独 像 少 尖 锐 的 细节 部 分 而 
突出 平 请 过 访 部 分 
“ 对 比 空 间 域 滤波 的 平 请 处 理 ， 如 均值 滤波 内 


避 通 滤波 左 : 使 局 频 通 过 而 使 低频 有 减 的 滤波 


8 了 


~ 和 梓 高 通 滤波 的 图 像 比 原 始 图 像 少 灰 度 级 的 平 请 过 波 
而 突出 边缘 等 细节 部 分 


~ 对 比 空 间 域 的 柳 度 算 子 、 拉 普 拉 期 算 子 





低 通 滤波 姬 和 高 通 滤 流 髓 举例 


低 通 滤 流 冰 数 低 通 渡 波 结果 : 模糊 








殖 [ 以 人 引 





一 Y N YL^ 一 Y 了 】 

[二 Y [1 十 全 烤 
sa 癌 通 滤波 函数 高 通 滤波 结 末 : 锐 { 
FICURE 4.7 (a) A two-dimensional lowpass filter function.(b) Result of lowpass filtering the image in Fig.4.4(al). 
(cj) A two-dimensional highpass filter function. (d) Result of highpass filtering the imase in Fig. 4.4(a). 











低 通 滤波 磺 和 高 通 滤 流 髓 举例 


融通 滤 衣 结 融通 滤 六 改进 结 


2 






w 因为 F(0, 0) 已 被 设置 为 0， 所 以 几乎 没有 平 清 
的 灰 度 级 细节 ， 且 图 像 较 暗 

~ 在 滤波 器 中 加 入 常量 ， 以 使 F(0, 0) 不 被 完全 消 
除 ， 如 网 所 示 ， 对 滤波 器 加 上 一 个 滤波 器 高 度 一 
半 的 稼 数 加 以 改进 《高 频 加 强 ) 





频率 域 泪 溉 
e 空间 域 滤 肖 和 录 率 域 沽 流 乙 则 的 对 应 关系 


“ 大 小 为 MXN 的 两 个 函数 ftx, y) 和 h(x, y) 的 离 
衣 疮 积 表 示 为 f(x, yj)xh tx y) ， 定 义 为 


je 人- Tan- 


“ 对 比 空 间 域 滤波 : 在 MXN 的 图 像 f 上 ， 用 
m 义 n 的 滤波 耸 进 行 线性 滤波 


gx 人 = 六 wenf(z+sy+H 


= 一 1 一 一 0 








频率 域 沽 波 
e 知 积 定理 
太 (x yj)x jx 了) < 人 全 人 (u v] 克 (& y) 
“ 上 式 说 明 空 间 域 卷 积 可 以 通过 Fu, vwH(u, v) 
的 乘积 进行 反 伟 里 时 变换 得 到 
太 (x yjJn(x， y < 人 全 人 (& y) 六 厅 (& y) 
“ 说 明 空 间 域 乘法 可 以 通过 频率 域 的 郑 积 获得 
v Re 
Y 








虎 率 域 源 估 ， 
e 定义 : 在 (xzo yao) ， 强 度 为 A 的 神 激 图 数 表 示 为 
4 一 ab， y 一 划 ) 定 义 为 


六 ae 一 An 
~ so y) 是 冲 诉 男 数 
~ 说 明 : sx, y) 只 在 (xo, yo) 处 有 为 A 的 图 像 
值 ， 其 它 处 的 值 全 为 0 





e 下 式 表 明 在 原点 处 (0, 0) 的 单位 神 激 情况 ， 
5 y) 表示 


二 sf y)5(x， y)= 5(0.0) 





e 根据 上 式 ， 原 点 处 (0, 0) 单 位 冲 激 的 傅 里 时 变换 


] 二 二 一 1277(UAA +VYAN) 
Sr 志 De yj 
X=0 y=0 


LT | 
MAN MXN 








频率 域 滤波 


e 假设 jcy)=5y)， 根 据 上 式 计算 原点 处 
(0, 0) 空间 域 的 卷 积 


上 4 -1N=-l 
5 = 志 5 7)j(x 一 my 一 九 ) 
-= X 一 0 y-0)= 一 一 px y) 
e 结论 


丰 yjxAxyj 人 会 YELLY 
(yj)#*jlry) 人 So oy) 
jx, y) 他 刀 (zy 








频率 域 滤 疲 





7](x， y) 心 刀 (zy 


v 上 述 公式 表明 ， 空 间 域 和 频率 域 中 的 滤波 器 组 成 了 全 
里 叶 变 换 对 

7 给 出 在 频率 域 的 滤波 器 ， 可 以 通过 反 信 里 叶 变 换 得 到 
在 空间 域 对 应 的 滤波 器 ， 反 之 亦 然 

7 滤波 在 频率 域 中 更 为 直观 ， 但 在 空间 域 一 般 使 用 更 小 
的 滤波 器 模板 

7 可 以 在 频率 域 指定 滤波 器 ， 做 反 变换 ， 然 后 在 空间 域 
使 用 结果 滤波 器 作为 在 空间 域 构建 小 滤波 器 模板 的 指导 








频率 域 泪 汲 
e 出 斯 频率 域 人 长 通 小 六 和 夫 函 数 


瑟 (x)= Ac 712 
对 应 空间 域 高 斯 低 通 滤波 需 为 





e 出 斯 频率 域 高 通 滤波 葵 函 数 
克 (z) = Ae /20 一 Be 12 4> 了 ,al >a， 
对 应 空间 域 高 斯 局 通 滤 溉 堪 为 
/1 如)= V2zo4e2ror 一 V2zroBe2r er 





频率 域 泪 溉 


频率 域 高 斯 低 通 滤波 器 频率 域 高 斯 高 通 滤波 器 


九 (0) 五 (I) ab 
已 加 


FIGURE 4.9 

(al) Gaussian 
frequency domain 
lowpass filter. 

(b) Gausslian 
frequency domain 
hiehpass filter. 

(c) Corresponding 
lowpass spatial 
filter. 

(d) Corresponding 
highpass spatial 
filter. The masks 
Ar) Ar) shown are Used in 
Chapter 3 for 
lowpass and 
highpass fltering. 











空间 域 高 斯 低 通 滤波 噩 空间 域 高 斯 高 通 滤波 噩 








频率 域 滤 疲 


e 结论 《〈 低 通 滤波 徐 ) 


~ 当 H(Cu) 有 很 宽 的 轮 廊 时 (大 的 c 值 ) ，h(Gx) 有 
很 罕 的 轮 亡 ， 反 之 亦 然 。 当 接近 无 限时 ， 
H(u 赵 于 钊 量 图 数 ， 而 hx) 趋 于 剖 油 函数 


“ 两 个 低 通 滤 六 亏 的 相似 之 处 在 于 两 个 域 中 的 
值 均 为 正 。 所 以 ， 在 空间 域 使 用 市 正 系 数 的 
模板 可 以 实现 低 通 滤波 

“ 录 率 域 低 通 滤 小 上 需 越 军 ， 滤 除 的 低频 成 分 吏 
越 多 ， 使 得 铬 像 瓯 越 模糊 ;在 空间 域 ， 这 和 意 
味 看 低 通 深 波 硕 吏 越 览 ， 模 板 融 越 大 








频率 域 滤 疲 


e。 结论 《融通 滤 度 耸 ) 
” 空间 域 滤 波 锅 有 正 值 和 负 值 ， 一 旦 值 变 为 负 
数 ， 束 再 也 不 会 变 为 正 数 
e 为 什么 频率 域 中 的 内 容 在 空间 域 要 使 用 小 空间 
模板 
“ 频率 域 可 以 拖 百 观 指定 凑 波 益 
“ 空间 域 沽 波 效 末 取 雇 于 空间 模板 的 大 小 





频率 域 图 像 增 强 

e。 频率 域 平滑 滤波 需 

~ 理想 低 通 滤波 圳 

~ 巴特 沃 思 低 通 滤波 器 
~ 高 斯 低 通 滤波 器 

~ 应 用 实例 





频率 域 图 像 增强 


e 频率 域 平 滑 滤 波 器 
~ 边缘 和 噪声 等 尖锐 变化 处 于 傅 里 叶 变 换 的 高 


频 部 分 

~ 平滑 可 以 通过 到 减 局 频 成 分 的 范围 来 实现 
~ 理想 低 通 滤波 右 : 尖 铅 

~ 巴特 添 思 低 通 滤波 左 : 处 于 理想 禹 期 滤波 











频率 域 图 像 增强 
e 理想 低 通 滤波 规 


~ 鹤 断 传 里 叶 变 换 中 的 所 有 融 频 成 分 ， 这 些 高 
频 成 分 处 于 指定 距离 Do 之 外 


1 Dov)<sD， 
on Devy)> ， 





~ 频率 抢 形 的 中 心 在 (u v)=(M2,NX2) ， 从 点 
(u v) 到 中 心 〈 原 点 ) 的 距离 如 下 


区 直 引 








频率 域 图 像 增强 
e 理想 低 通 滤波 规 


如 ( 7 嫩 ( 纺 7) 





LA 1 DPI(CD) 





3 居 D| 取 
FIGURE 4.10 (a) Perspective Plot of an ideal lowpass filter transfer function. (b) Filter displavyed as an 
imase.(c) Filter radial cross Section. 


次 明 : 在 半径 为 Du 的 圆 内 ， 所 有 频率 没有 桶 减 地 通过 涯 
流 郁 ， 而 在 此 半径 的 圆 之 外 的 所 有 频率 完全 被 桶 减 押 





频率 域 图 像 增 强 
e。 理 息 低 通 滤 波 丹 
总 图 像 功率 值 P， 


上 -1N-l 


有 已 => > Per 


=0 Vv=0 
P(u y) 一 。 Fu 中 一 R(L， y 十 7( y 





~ 原点 在 频率 上 写 形 的 中 心 ， 半 径 为 r 的 圆 包含 cc% 
的 功率 ， 其 中 


C = 'o0| 也 2 Pen/ 有 





理想 低 通 滤 流 和 耸 举 例 








500X500 像 素 的 原 图 图 像 的 傅 里 叶 频 谱 
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FIGURE 4.11 (a) An imasge of Size S00 X S00 Pixels and (bj its Fourier spectrum. The 
Superimposed circles have radil values of 3 13. 30. 80. and 230， which enclose 92.0、 


94.6. 96.4. 98.0.and 99.3% of the image power, respectively. 


圆 环 具 有 半径 5, 15, 30, 80 和 230 个 像 系 
图 像 功率 为 92. 0%, 94. 6%, 96. 4%, 98. 0% 和 99. 5% 








理想 低 通 滤波 器 举例 _ “具有 振 铃 现象 上 








结论 : 半径 D 越 小 ， 模 糊 越 大 ， 半 径 Du 越 大 ， 模 糊 越 小 


原 图 


半径 是 15 的 理想 低 通 
滤波 , 滤 除 5. 4% 的 总 
功率 


半径 是 80 的 理想 低 通 
滤波 , 滤 除 2% 的 总 功率 


下 
合 所 
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半径 是 5 的 理想 低 通 滤 
波 , 滤 除 8% 的 总 功率 ， 
模糊 说 明 多 数 尖锐 细 
节 在 这 8% 的 功率 之 内 


半径 是 30 的 理想 低 通 滤 
波 , 滤 除 3. 6% 的 总 功率 


半径 是 230 的 理想 低 通 
滤波 , 滤 除 0. 5% 的 总 功 
率 ， 与 原 图 接近 说 明 
边缘 信息 在 0. 5% 以 上 
的 功率 中 














频率 域 图 像 增强 


或 国 数 H(u，Yv) 
半径 为 5 的 ILPF 


对 应 空间 域 h (x, y) 


心 台 的 圆 环 质 
) 由 黑色 背景 中 心 开 始 的 圆 环 周期 


明亮 的 像素 组 成 ， 
芯 可 看 作 神 激 





f(x, y)#h (x, y) , 在 每 
个 冲 激 处 复制 h(x, y) 
的 过 程 ， 振 铃 现 象 


a b 
c qd 
FIGURE 4.13 (a) A frequency-domain ILPF of radius 5. (b) Corresponding spatial 
filter (note the rinseing).(c) Five impulses in the spatial domain,. simulating the values 
of five pixels.(d) Convolution of (b) and (c) in the spatial domain. 








频率 域 图 像 增 强 
e。 巴特 沃 思 低 通 滤波 器 


w n 级 巴特 沃 思 低 通 滤波 器 (BLPP) 定义 如 下 
] 


TO 


DJ, 为 截至 频率 距 原 点 的 距离 ，D (u, v) 是 点 \u v) 距 
原点 的 距离 
v 不 同 于 ILPF，BLPF 变 换 函 数 在 通 市 与 航 庆 除 的 否 率 
之 间 没 有 明显 的 堆 断 
~ 当 D(u vi=D 时 ，Hku, v) =0. 5( 最 大 值 是 1， 当 
D(u, v) =0) 





巴特 沃 思 低 通 滤 疲 规 


透视 图 滤波 器 阶 数 从 1 到 4 的 滤波 器 模 截 面 


五 (&,21) 瓦 ( 引 7) 











齐 呈 让 


FIGURE 4.14 (a) Perspective plot of a Butterworth lowpass filter transfer function. (b) Filter displayed as an 
imasge.(c) Filter radial cross Sections of orders 1 throush 4. 


应 用 : 可 用 于 平滑 处 理 ， ee 
廓 时 ， 和 常 可 用 低 通 滤波 进行 平滑 以 改进 网 像 质 量 。 通 党 ， 
BLPF 的 平滑 效果 好 于 ILPF 〈 振 铃 现 象 ) 。 
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原 图 








EC 


径 是 15 的 BLPF 滤 波 | 半径 是 30 的 BLPF 滤 波 


[aaaaaaaa 











“三 | :3 


讼 Y2 6 又 纪 4 \ 直 
册 IN 。 WIIINN 。 关 多 是 230 的 BLPF 波 波 


| 人 aaaaaaaa 


径 是 80 的 BLPF 滤 波 











ab FIGURE 4.15 (a) Ori 和 认 必 六 二 s of filteri h BILPFS of order 2 
Ed with cutoff frequenc and 230 0 in 互 8. 4.11(b). 
已 Compare with Hi 4.2 2. 





【LEE 


巴特 沃 思 低 通 滤 疲 规 


所 有 的 滤 让 和 希 都 有 半径 为 5 的 截至 频率 D。 


阶 数 n=1l 阶 数 n=2 阶 数 n=5 阶 数 n=20 
无 振 铃 和 负 值 ”轻微 振 铃 和 负 值 ”明显 振 铃 和 负 值 ”与 ILPF 相 似 


回回- 
上 人 上 


引申 四 




















FIGURE 4.16 (a)-(d) Spatial representation of BLPFS of order 1.2.3.and 20.and corresponding gray-level 
profiles 0 1 the center of the filters (all filters have a cutoff frequency of 3). Note that ringing increases 
as afunction of filter order. 


二 阶 BLPF 处 于 有 效 低 通 滤波 和 可 接受 的 振 铃 特征 之 间 





频率 域 图 像 增强 
e。 局 斯 低 通 滤波 需 
w 二 维 高 斯 低 通 滤 波 器 (GLPF) 定义 如 下 
瓦 JJ=e2 人 2 





“ Du 岂 古 点 (uv) 距 原点 的 距离 ， 使 c= 认 
刀 (z yj= 


~ 当 D(u, v) =Du 时 ， 涯 流 器 下 降 到 和 它 最 大 值 的 0. 607 处 





高 斯 低 通 滤波 需 








0.667 





DI(u4 7) 





遇 国 | 届 


FIGURE 4.17 (a) Perspective plot of a GLPF transfer function. (b) Filter displayed as an image.(c) Filter 
radial cross sections for various values of 忆 ,. 








高 斯 低 通 滤波 器 





原 图 


15 的 GLPF 滤 波 


径 是 


径 是 80 的 GLPF 滤 波 
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5 的 GLPF 滤 波 


半径 是 30 的 GLPF 滤 波 


半径 是 230 的 GLPF 滤 波 


FIGURE 4.18 (3a) Original image.(b)-( 曲 Results of filtering with Gaussian lowpass 豆 蔬 
屿 ters With cuto 芷 frequencies set at radii Values of S. 13, 30, 80, and 230, as Shown im 莹 到 


Fig.4.11(b). Compare with Figs. 4.12 and 4.15. 


e 于 





频率 域 图 像 增强 
等 基准 PC 


~ GLPF 不 能 达到 有 相同 和 规 止 频率 的 二 阶 
BLPF 的 平 请 效果 
~ GLPF 没 有 振 铃 


~ 如 朱 需 要 严格 控制 低频 禹 频 之 间 鹤 
至 闫 率 的 过 涛 ， 选 用 BLPF， 代 价 征 可 能 
人 





频率 域 图 像 增强 
e。 低 通 滤波 大 的 应 用 实例 : 模糊 , 平 清 等 
7 字符 识别 ， 通 过 模糊 图 像 ， 桥 接 断 裂 字符 的 
裂 经 
7 印刷 和 出 版 业 ， 从 一 幅 尖锐 的 原始 图 像 产生 
平滑 、 和 柔和 的 外 观 ， 如 人 脸 ， 减 少 皮肤 细 纹 的 
锐 化 程度 和 小 斑点 
7 处 理 卫星 和 航空 图 像 ， 尽 可 能 模糊 细节 ， 而 
保留 大 的 可 识别 特征 。 低 通 滤波 通过 消除 不 重 
要 的 特征 来 简化 感 兴趣 特征 的 分 析 





字符 识别 举例 


如 打印 、 传 真 、 复 印 文本 等 ， Du=80 的 高 斯 低 通 滤 肖 器 
字符 失真 、 字 符 断 裂 等 修复 字符 








a b 

FIGURE 4.19 Historically，cPrtai computer Historicaliy，certain computer 
(al) Sample text of prograPmms 六 ErfeG Written USing programs were written USing 
poor resolution ， 二 

痢 全 于 生生 Onily twa 起 可 小 S 人 ah 全 人 七 拉 有 人 oniy two digits rather than 
characters in four ra define trhe ppiicabie four to define the applicabtle 
和 ad year、Accordingiy，the year、 Accordingly,， the 

filtering with a cempany's 59 御 闪 are nay company's 50ftware may 
Re recognize 3 date Using "00" recognize a date using "00" 
ee as 1i900 rather than the yE 引 r || as 1900 rather than the yEalr 
joined). 





用 于 机 硕 识 别 系 统 识 列 断 叙 字符 的 预 处 理 





人 脸 图 像 处 理 


原 图 像 Du=100 的 GLPF 滤 波 ， “Du=80 的 GLPF 滤 波 ， 
细 纹 减少 细 纹 减少 











型 加 中 


FIGURE 4.20 (a) Original Imase (1028 X 732 pixels). (b) Result of filtering with a GLPF with Du = 100. 
(c) Result of filtering with a GLPF with Du = 80.Note reduction in skin fine lines in the masnified sections 
of (b) and (c). 





人 脸 图 像 处 理 


原 图 像 D,=30 的 GLPF 滤 波 Dj=10 的 GLPF 滤 波 ， 











FIGURE 4.21 (a) Imase showing Prominent Scan lines. (b) Result of using a GLPFE with Du = 30.(c) Result 
of using aGLPF with Du = 10.(Oripginal Imase courtesy of NOAA.) 


目的 : 尽 可 能 模糊 细节 ， 而 保留 大 的 可 识别 特征 





频率 域 图 像 增强 


e。 频率 域 锐 化 滤波 器 

~ 理想 高 通 滤波 需 

v 巴特 沃 思 高 通 滤 波 器 
~ 局 斯 局 通 滤波 苍 

~ 频率 域 的 拉 普 拉 斯 算 子 


链 化 贷 板 、 高 频 捉 升 滤波 和 遍 频 加 强 
涛 沁 





v 


频率 域 饶 化 滤波 天 


透视 图 图 像 表 示 “，. 横 截面 
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四 高 斯 高 通 滤波 器 


站 1D(aL D) 











FIGURE 4.22 Top row: Perspective plot. imasge representation. and cross section of a typical ideal hiehpass 
filter Middie and bottom rows: The same sequUence for typical Butterworth and Gaussian hiehpass filters- 


巴特 沃 思 滤 波 器 为 理想 滤波 器 的 尖锐 化 和 高 斯 滤波 局 的 完全 光 谓 之 
间 的 一 种 过 访 





频率 域 饶 化 滤波 天 


理想 高 通 滤波 器 巴特 沃 思 高 通 滤波 器 高 斯 吉 通 滤波 器 


v 
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FIGURE 4.23 Spatial representations of typical (a) ideal、(b) Butterworth，and (c) Gaussian frequency 
domain hishpass filters. and corresponding 5ray-level profiles. 





频率 域 图 像 增 强 
e 理想 高 通 滤波 需 


~ 鹤 断 传 里 叶 变 换 中 的 所 有 低频 成 分 ， 这 些 低 
频 成 分 处 于 指定 距离 Do 之 内 





~ 频率 抢 形 的 中 心 在 (u v)=(M2,NX2) ， 从 点 
(u v) 到 中 心 〈 原 点 ) 的 距离 如 下 








图 b: D,=30 ”图 c，D,=80 
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FIGURE 4.24 Results of ideal hishpass fltering the Imase in Fig. 4.11(a) with Do = 13，30，and 80、 
respectively. Problems with ringing are quite evident in (a) and (bb). 


结论 : 图 a 和 b 的 振 铃 问题 十 分 明显 





频率 域 图 像 增强 


雪 巴特 添 思 高 通 滤波 器 
~ n 阶 且 稚 至 锁 率 距 原点 的 距离 为 Do 的 巴特 斌 
思 高 通 滤波 右 (BHPP) 定义 为 
1 
1+|D Deyj 





感 (zy)= 
v 推 对 


瑟 可 =1- 瑟 (=1 


1+[DpowyDF 
本 -[Dlu y/ 及 | 二 | 


1+|Dlu yj/ 已 靖 1+| 记 / Du 吕 





二 阶 巴 特 沃 思 高 通 滤波 器 





图 a: Du=19 图 b: D,=30 





3 了 


FIGURE 4.25 Results of highpass filtering the Imase in Fig. 4.11(a) using aBHPF of order 2 with Du = 13、 
30.and 80, respectively These results are much Smoother than those obtained with an [ILPFE. 


结论 BHPF 的 结果 比 IHPF 的 结果 平滑 得 多 








频率 域 图 像 增强 





e。 山 斯 高 通 滤波 和 需 
~ 和 帘 频 中 原点 为 Du 的 高 斯 高 通 滤波 霹 (GHPP) 定 
克 ( y) ee 











图 a: Du=15 图 b: Di=30 图 c:，D,=80 





2 让 


FIGURE 4.26 Results of hishpass filtering the imagpe of Fig. 4.11(a) using a GHPF of order 2 with Du = 13、 
30.and 80, respectively Compare with Flss. 4.24 and 4.23. 


结论 ; GHPF 的 结果 比 BHBF 和 IHPF 的 结果 更 平滑 





频率 域 图 像 增强 
。 频率 域 的 拉 普 拉 斯 算 子 定义 





2 = (7 天 oo 
可 以 得 到 
j 2 人 | = (JJ Fo) Fe 
一 (ze 十 jle) 
即 


S|v2F(x， y)]|= 到 十 ojF(ey) 二 媚 (uvJF(ey) 


所 以 五)=-(e2+) 








频率 域 图 像 增强 


e 原点 从 (0, 0) 移 到 (MX2, NM2), 所以， 滤波 函数 
刀 (yn)=--M7 2 +O-N12| 
宝 辣 域 拉 普 拉 斯 算 子 过 涛 后 的 图 像 可 由 计算 
Hu, viF'u, v) 的 反 傅 里 时 变换 得 到 
V2F(x， 7)= S- 人 lc 一 4I 12) 十 ( -N/2PjeGoy) 
傅 里 时 变换 对 表示 空间 域 拉 普 拉 斯 算 子 和 矣 率 
域 的 双 回 关系 


Yo) 一 -人 -WO2F+GC-N/Pen 





频率 域 图 像 增强 


图 a: 频 率 域 拉 普 拉 斯 的 三 维 图 


6 





图 p :图 a 的 图 像 表示 


谢 


RE 


空间 域 拉 普 图 d: 图 c 的 放大 图 像 
图 e: 通过 图 qd 中心 的 
灰 度 剖面 图 


YY 】 上 下 
c sd 图 f: 空间 域 的 拉 普 拉 斯 模板 
FICURE 4.27 (a) 3-D plot of Laplacian in the frequency domain. (b) Imase representation of (al). 
(c) Laplacian in the spatial domain obtained from the inverse DEFT of (b). (d) Zoomed section of the orisin 
of (cj.(e) Gray-level profile throush the center of (d). (人 Laplacian mask used in Section 3.7. 














频率 域 图 像 增强 


e。 从 原始 图 像 中 减 去 拉 普 拉 期 算 子 部 分 ， 
形成 g (xz, y) 的 增强 图 便 


syj=jey-V Acy 








拉 普 拉 斯 举例 说 明 


月 球 北极 图 像 拉 普 拉 斯 滤波 后 的 图 像 


a hb 
cd 


FIGURE 4.28 

(a) Imase of the 
North Pole ofthe 
moon. 

(b) Laplacian 
filtered imase. 
{c) Laplacian 
imase Scaled. 

(dj Image 
enhanced by 
Usins 下 q. (4.4-12). 
(Original imase 
coUrtesy of 
NASA.) 


增强 的 图 像 
原 图 十 拉 普 拉 斯 图 像 


标定 后 的 图 像 : 
因为 具有 正 值 
和 人 负 值 





频率 域 图 像 增强 


e。 频率 域 锐 化 滤波 器 

~ 理想 高 通 滤波 需 

v 巴特 沃 思 高 通 滤 波 器 
~ 局 斯 局 通 滤波 苍 

~ 频率 域 的 拉 普 拉 斯 算 子 


~ 钝 化 贷 板 、 高 频 捉 升 滤波 和 忆 频 加 强 
小 沁 





频率 域 图 像 增强 





。 为 什么 要 进行 高 频 手 升 和 高 频 加 强 ? 


~ 凯 频 滤波 后 的 儿 像 ， 其 育 景 平 均 强 度 
减 小 到 接近 黑色 “〈 因 为 高 通 滤 波峰 滤 除 
了 傅 里 时 杰 换 的 零 频 率 成 分 : 

F(0, 0) =f(x, y) =0) 

~ 解雇 办 法 : 把 原始 图 像 加 到 过 小 后 的 


结果 ， 如 拉 普 拉 斯 算 子 增强 ， 这 种 处 理 
称 为 高 频 提 升 过 滤 








频率 域 图 像 增强 


e 钝 化 模板 ( 锐 化 或 高 通 几 像 ) : 从 一 幅 图 像 减 去 
其 目 身 模糊 网 像 而 生成 的 锐 化 图 像 构 成 。 在 频率 
域 ， 即 从 图 像 本 映 减 去 低 通 滤波 〈 模 糊 ) 后 的 图 
像 而 得 到 高 通 滤 波 《〈 馈 化 ) 的 图 像 

万 ( 人 了 = 一 万 Cy 


e 总 频 提 升 过 滤 : 

亡 (c7=A4AHe 中 -万 Co 
=(4-DHey+Fcy -万 Ccy 
=(4-DHe + 用 Cey 
当 A=1, 即 高 通过 滤 ;， 当 A>1, 累加 图 像 本 身 








频率 域 图 像 增强 


局 频 捉 升 过 小 〈 续 ) : 
由 厅 ， 人 =1 一 厅 ，(oy 


高 频 提 升 过 滤 可 以 定义 为 
克 人 y) 二 (4-U+ 玖 人 y 











高 频 提升 过 滤 举 例 一 一 频率 域 滤 这 


图 a: 输入 图 像 ”图 b: 图 a 的 拉 普 拉 斯 图 像 


a b 
| 


FIGURE 4.29 
Same as Fig. 3.43、 
but Using 
frequency domain 
filtering.(a) Input 
Imasge. 

(Pb) Laplacian of 
(aj.(c) Imase 
obtained using 
Edq. (4.4-17) with 
4=2.(d)Same 
as (cj, but with 

4 =2.7.(Original 
imase courtesy of 
Mr. Michael 
Shaffer， 
Department of 
Geologlical 
Sciences， 
University of 
Oreson, Eugene.) 





频率 域 图 像 增强 


。 噩 频 所 升 加 强 : 


羽 ,他 可 一 +D 厅 人 y 





0 过 >0,D>a 
~ 用 图 像 的 局 频 成 分 进行 增强 
~ 增加 a 的 目的 是 使 零 频率 不 被 滤波 吉 过 波 
~ 当 a=A-l b=1 时 转化 为 局 频 提升 过 泪 
~ 当 b>1， 忆 频 得 到 加 强 





高 频 提升 加 强 举例 


图 a: 胸部 X 认 图 像 图 p: 巴特 沃 思 高 通 滤 波 的 结果 


a b 

加 加 

FIGURE 4.30 

(a) A chest 和 -ray 
image.(b) Result 
of Butterworth 
highpass filterins. 
(c) Result of high- 
frequency 
emphasis fltering. 
(d) Result of 
performing 
histosram 
equalization on 
(c). (Original 
Image coUrtesy 
Dr. Thomas 
R.Gest, Division 


隐 :2 of Anatomical 

全- 村 SciencesS、 

多 于 ， University of 

1 0 5 Michigan Medical 
} 


School.) 


图 c: 高 频 增 强 滤波 的 结果 图 d: 图 直方 图 均衡 化 的 结果 


注 : 高 频 加 强 十 直方 图 均衡 化 的 论 合 图 像 增强 方法 














数字 图 像 处 理 〈6 ) 


任何 问题 ? 
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图 像 复原 


。 图 像 退 化 /复原 过 程 的 模型 

e。 噪声 模型 

e 空间 域 滤 波 复 原 〈 唯 一 退化 是 噪声 ) 
e。 需 率 域 滤 六 复原 《前 减 周期 噪声 ) 








图 像 复原 
e。 什么 是 退化 ? 
成 像 过 程 中 的 ”退化 ”， 和 是 指 由 于 成 像 系统 各 种 
因 系 的 影响 ， 使 得 狗 像 质量 降低 
。 引起 图 像 退 化 的 原因 
~ 成 像 系 统 的 散 焦 
~ 成 像 设 备 与 物体 的 相对 运动 
“ 成 像 硕 材 的 固有 缺陷 
~ 外 部 干扰 等 








图 像 复 原 

。 图 像 复原 颁 述 

7 与 图 像 增强 相似 ， 图 像 复 原 的 目的 也 是 改 关 
图 像 质量 

” 图 像 增强 主要 是 一 个 主观 过 程 ， 而 图 像 复 原 
主要 是 一 个 客观 过 程 

7 图 像 增强 被 认为 是 一 种 对 比 度 拉 伸 ， 提 供给 
用 户 喜欢 接收 的 图 像 ， 而 图 像 复原 技术 追求 恢 
复原 始 图 像 的 最 优 估 值 

7 图 像 复 原 技术 可 以 使 用 空间 域 或 频率 域 滤波 
器 实现 








图 像 复原 
e。 图 像 复原 概述 《〈 续 ) 


~ 图 像 复 原 可 以 看 作 疼 像 退化 的 逆 过 程 ， 是 将 
图 像 退化 的 过 程 加 以 估计， 建立 退化 的 数学 模 
型 后 ， 补 偿 退 化 过 程 造成 的 失真 

~ 在 几 像 退化 确 知 的 情况 下 ， 图 像 退 化 的 逆 过 
程 是 有 可 能 进行 的 

v 但 实际 情况 经 名 是 退化 过 程 并 不 知晓 ， 这 种 
复原 称 为 理 目 复 诛 


“ 由 于 图 像 醒 糊 的 同时 ， 噪 声 和 干扰 也 会 同 
时 存在 ， 这 也 为 复原 市 来 了 困难 和 不 确定 性 











图 像 复原 


FIGURE 5.1 人 

model of the 
Yy) image 

de orad: ation/ 
restoration 
PrOcess. 


DEOR4D47TTON RESTOR47TTON 


~ f(x, 思 表示 一 幅 输 入 疼 像 

~ gx 7 是 fx y 产 生 的 一 幅 退 化 图 像 
~ H 表 示 退 化 函数 

~ zc,y) 表 示 外 加 噪声 


v 给 定 g ( 刺 y) ，H 和 ztx,y) ,怎样 获得 关于 原始 图 像 的 
近似 估计 (xy) ? 


图 像 复原 


e。 如 朱 系 统 H 是 一 个 线性 、 位 置 不 变性 的 过 
枉 ， 退 化 图 像 可 以 表示 为 


gs 中 =Aeyj#FcyHey 


儿 空间 域 上 的 卷 积 等 同 于 频率 域 上 的 乘积 


Go y 一 屿 (& 7 y 十 NI y 


h (xz, 思 表 示 退 化 函数 的 空间 描述 








图 像 复原 


噪声 模型 
“ 数字 图 像 的 噪声 主要 来 源 于 图 像 的 获取 和 传 
答 过 程 
> 几 像 获取 的 数字 化 过 程 ， 如 图 像 传 感 右 的 
质量 和 环境 条 件 


> 赂 像 传 葵 过 程 中 传输 信道 的 噪声 干扰 ， 如 
通过 无 线 网 络 传输 的 独 像 会 受到 光 或 其 它 
大 气 因素 的 干扰 








图 像 复原 


一 些 重要 的 噪声 
， 高 斯 品 


王 上 上 
六 
“ 瑞 利 噪声 








一 些 重要 噪声 








已 (z) P(z) 

1 2 
一 一 -一 上 上--------------- 0.GX 二 |-------- 
Varo 7 AV 石 














Gaussian Rayleigh 


一 了 0O.607 1 
二 VER | 
局 ] 汪 人 


1 
1 
1 
用 一 玫 天 用 十 加 过 到 


已 (z) 
Gamma Exponential 


二 af 证 一 JR 2 
全 三 1 


伽 马 









Uniform Impulse 


均匀 





高 斯 噪声 


2 
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(z-4 六 /2 
275O 


的 概率 密度 函数 (PDF) 由 下 式 给 出 
p(z)= -天 





v do cjw+oj 围 内 ， 有 95% 
洛 在 [ww-2c)(w+2cj 范围 内 


图 像 复原 


e 菇 利 噪声 
~ 瑞 利 噪声 的 PDF 由 下 式 给 出 
忆 加 -(z-a) /2 
p(z)= 0 


0 


LUL =Q+NVZDI/A1 
-24 一 工 ) 
4 


“ 距离 原点 的 位 移 是 a 
“ 国 数 曲线 回 右 变形 











图 像 复原 


e。 伽 马 《爱尔兰 ) 噪声 


“ 伽 马 噪声 的 PDF 由 下 式 给 出 


_ -1 








CL 
人 人， 一 da Z 之 Q 
p(C)=1C2T) 
0 二 < L 
忆 
了 
CL 
TI“ = 








图 像 复原 
e 指数 分 布 噪声 


“ 指数 噪声 的 PDF 由 下 却 给 出 ， 其 中 , a>0 








Ce 和 Z 之 和 
"G)-| 
0 Z < Qa 
LL 三 一 
CL 
] 
网 
CD 一 
六 “ 


~ 指数 分 布 的 PDF 是 当 b=1l 时 爱尔兰 分 布 的 特殊 
情况 





图 像 复原 
e 均匀 分 布 噪声 
“ 均匀 分 布 噪声 的 PDF 由 下 云 给 出 








IE 0<Z<D 
0 其 它 
Gd+D 
2 
2 忆 一 <) 








图 像 复原 
。 脉冲 噪声 〈 椒 盐 噪 声 ) 
“ 脉冲 噪声 的 PDF 由 下 式 给 出 


有 三 癌 
P(z)= 4 5 一 
0 其 它 


“ 如 朱 ps 或 pi 为 零 ， 则 脉冲 噪声 称 为 单 极 脉冲 


“ 如 果 p. 或 p, 均 不 为 零 ， 则 脉冲 噪声 称 为 双 极 
脉冲 噪声 或 椒盐 噪声 





图 像 复原 


e 肪 名 噪声 《椒盐 噪声 ) 《〈 续 ) 

“ 脉冲 噪声 可 以 为 正 ， 也 可 为 负 

“ 标定 以 后 ， 脉 冲 品 声 总 是 数字 化 为 最 大 值 
〈《 纯 黑 或 纯 日 ) 

“ 通 币 ， 负 脉冲 以 黑 点 〈“ 胡 椒 氮 ) 出 现 ， 正 脉 
冲 以 白 点 〈 盐 点 ) 出 现 








图 像 复原 


。 儿 种 噪声 的 运用 
“ 高 斯 噪声 源 于 电子 电路 噪声 和 由 低 照 明度 或 
融 温 市 来 的 传感器 噪声 
“ 瑞 利 噪声 对 分 布 在 图 像 范 围 凡 特征 化 噪声 有 
用 


“ 伽 马 分 布 和 指数 分 布 用 于 激光 成 像 噪声 

” 均匀 窗 度 分 布 作 为 借 拟 随机 数 产 生 礁 的 基础 

“ 脉冲 噪声 用 于 成 像 中 的 短 丢 停留 中 ， 如 错误 
的 开关 拘 作 








样本 噪声 图 像 和 它们 的 直方 图 





FIGURE 5.3 Test 
Dattern Used to 
llustrate the 
characteristics of 
the nolse PDFs 
shown in Fie. .2. 


~ 用 于 噪声 模型 的 训 弃 图 
~ 由 简单 、 恒 定 的 区 域 组 成 
仅仅 有 3 个 灰 度 级 的 变化 


CGIamma 


Rayleigh 





Gausslan 


Di 
0 
FIGURE 5.4 Imasges and histograms resulting from adding Gaussian.Ravleigh. and gamma noise to the image 


in Fig. 3.3. 





直方 图 





Exponential Uniform Salt K Pepper 


FIGURE 5.4 (Comtrmzred) Imases and histograms resulting from adding exponential uniform. and Impulse 
noise to the Imase in Fig. 3.3. 





样本 噪声 图 像 和 它们 的 直方 图 
e 结论 
~ 上 述 噪 声 图 像 的 百 方 匈 和 筷 们 的 概率 密度 
国 数 曲线 对 应 相似 
~ 前 面 5 种 噪声 的 多 像 并 没有 蛙 考 不 同 
~ 但 它们 的 直方 多 具有 明显 的 区 别 








图 像 复原 


e。 半期 噪声 


~ 周期 噪声 是 在 图 优 获取 中 从 电力 或 机 
电 干 扰 中 产生 


~ 周期 噪声 可 以 通过 频率 域 滤 小 显 著 减 


少 





图 像 复原 
_。 空间 域 滤波 复原 〈 唯 一 退化 是 
当 唯一 退化 是 噪声 时 ， 

sy= cy)+7e yj) 


G(U y) 旦 加 ( y)+N(u， y) 
~ 噪声 项 未 知 ， 不 能 从 gx, y) 或 Gu v) 减 去 品 
声 
~ 可 以 选择 空间 滤 关 方法 进行 图 像 复原 





图 像 复原 


e 图 像 复 原 的 空间 滤波 喜 
v 均值 滤波 器 


算术 均值 滤波 秦 、 几 何 均 值 滤 流 苍 、 谐 波 均 值 滤 沁 
器 、 逆 谐 波 均值 滤波 器 


~ 顺序 纺 计 滤 流 筑 


中 值 滤波 规 、 最 大 值 滤波 规 、 最 小 值 沽 波 锅 、 中 后 
涛 流 磺 、 修 正 后 的 阿尔 法 均值 滤波 需 


~ 目 适 应 雇 波 和 规 
目 适 应 局 部 噪声 消除 滤波 规 、 目 适应 中 值 凑 小 和 需 








。 算术 均值 滤波 融 





~ S$ 表 示 中 心 在 (zx 放 ， 乒 十 为 mnXn 的 窃 形 窗 
门 


v 平滑 了 一 幅 图 像 的 局 部 变化 
v 在 模糊 了 结果 的 同时 减少 了 噪声 





。 儿 何 均值 滤 闵 人 


和 包 -| 了 se 


~ 几何 均值 滤波 器 所 达到 的 平滑 度 可 以 与 算术 
均值 滤波 右 相 比 

v 但 几何 均值 滤波 器 在 滤波 过 程 中 ， 与 算术 均 
值 沽 波峰 相 比 ， 会 丢失 更 少 的 图 像 细 节 一 一 相 
对 锐 化 








。 诺 疲 均值 尖 波 般 


人 


ju 让 = 一 


(sjsSy。 gs(s， 1 





v 谐 波 均值 滤波 器 对 于 “ 盐 ? 噪 声效 果 好 ， 但 不 
适用 于 “胡椒 "噪声 


7 善于 处 理 高 斯 噪声 等 








e 逆 谐 波 均值 滤波 器 
> got 


(sijsS 训 


> sg(st 


(sijsS 罗 


人 


Hey= 


4Q 称 为 滤波 郁 的 阶 数 。 当 为 正 数 时 ， 用 于 消除 “了 明 
椒 "噪声 ， 当 9 为 负 效 时 ， 用 于 消除 “人 盐 ? 噪 声 ， 但 不 能 
癌 时 消除 “ 椒 址 "噪声 


~ 当 Q=0， 逆 庶 波 均值 滤波 天 转变 为 算术 均值 滤波 毅 
“ 当 Q=-1， 逆 谐 流 均值 滤波 规 转 变 为 庶 流 均值 滤波 规 





均值 滤波 举例 


原 图 被 均值 为 0， 方 差 为 400 的 高 斯 噪声 污染 


ab 
较 陆 


FIGURE 5.7 (a) 
X-Tay Image. 

(b) Imase 
corrupted by 
additive Gaussian 
nolise.(c) Result 
of filtering with 
an arithmetic 
mean flter of Size 
3 X 3.(d) Result 
of filtering with a 
geometric mean 
filter ofthe same 
Size. (Orioinal 
image coUrtesy of 
Mr. Joseph E. 


是 所 胞 让 四 49194949 人 Pascente. Lixi、 








Inc.) 


< 23-nirp3r 轿 站 - ， ws 列 人 


和 


了 旬 革 1 芭 太 
只 通 喜 末 荐 号 2 


滤波 器 波 器 ， 图 像 更 清晰 








均值 滤波 举例 


“胡椒 "噪声 干扰 图 像 ”“ 盐 ?噪声 干扰 图 像 





a Pb 
| 


FIGURE 5.8 

(a) Image 
corrupted by 
Pepper nolse with 
a _ probability of 
0.1.(b) Imasge 
corrupted by salt 


(d) Result of 
[Nering (P) with 








3X3 大 小 ，Q=1. 5 的 3X3 大 小 ，Q=-1. 5 的 
闭 谐 波 均值 滤波 器 “” 道 谐 波 均 值 滤波 器 





才 Z 士 
@ 局 2 


， 算术 均值 滤波 器 和 几何 均值 滤波 器 适合 于 处 
理 高 斯 或 均匀 等 随机 噪声 


v 谐 波 均值 滤波 器 适合 于 处 理 脉冲 噪声 


缺点 ， 必 须 事先 知道 噪声 是 暗 噪声 ; 
噪声 ， 以 便于 选择 合适 的 9 符号 








全 
名 
员 








顺序 统计 滤波 名 
e。 中 人 滤波 闫 


He y)= medign {8 (5,1 


~ 在 相同 尺寸 下 ， 比 起 均值 滤波 器 引起 的 模糊 


少 


~ 对 单 极 或 双 极 脉冲 噪声 非常 有 效 





顺序 统计 滤 淫 名 
e。 了 节 大 值 沽 六 秀 





人 7)= MaX {g(s:r 


(srjsS。 


~ 用 于 及 现 图 像 中 的 最 党 操 


v 可 以 有 效 过 滤 “ 胡 椒 噪 声 〔〈 因 为 “胡椒 噪声 
是 非常 低 的 值 ) 








顺序 统计 滤 肖 齿 


人 


太 (x， y)= mn {g(s,r 


(srjsSu。 


~ 用 于 及 现 图 像 中 的 最 上 暗 氮 


， 可 以 有 效 过 滤 “ 盐 ”了 噪声 ( 因为 “ 盐 ?” 噪 声 是 非 
贡 融 的 全 ) 





顺序 统计 滤波 名 
e。 中 所 滤波 从 


/= 中 ma GO 


2 St)jES。 (srjsS， 





~ 结合 了 顺序 统计 和 求 平 均 


~ 对 于 高 斯 和 均匀 随机 分 布 这 医 噪 声 有 了 最 好 的 
效 琳 





顺序 统计 滤波 名 
。 修正 后 的 阿尔 法 均 信 滤波 益 


fley)j= 一 gl(sr] 


11111 一 Q 人 
~ 在 $,, 邻 域内 去 掉 g(s, t) 最 高 灰 度 值 的 dq/2 和 最 低 灰 
度 值 的 d/2 
~ g(s, t) 代 表 剩 余 的 mn-d 个 像 际 
~ 当 d=0， 退 变 为 算术 均值 沽 流露 
~ 当 d=m-l) /2， 退 变 为 中 值 滤波 需 
~ 当 d 取 其 它 值 时 ， 适 用 于 包括 多 种 噪声 的 情况 下 ， 例 


如 高 斯 噪声 和 椒 址 噪声 刘 合 的 情况 














中 值 沽 小 郁 举例 


.=P,=0. 1 的 脉冲 


三 人 1 


P 


a b 
| 


FIGURE 5.10 

(a) Image 
corrupted by salt- 
and-pepper noise 
with probabilities 
也,= 防 =0.1. 
(Pb) Result of one 
Pass with a 
median filter of 
aize3X 3. 

(c) Result of 
Processing (b) 
with this flter. 
(d) Result of 
Processing (c) 
with the same 
filter. 






本 
ae EL 


第 二 次 中 值 滤波 器 处 理 ”第 三 次 中 值 滤波 器 处 理 ， 全 部 噪声 消除 





最 大 值 和 最 小 值 滤波 和 硕 举 例 


“胡椒 " 嗓 声 干扰 图 像 “起 ?" 噪 声 干 扰 图 像 








.8(al) with a 
max filter of SiZe 
3 X 3.(b) Result 
of filtering >.S(b) 
with a min filter 
of the same SiZze. 





二 23 


最 大 值 滤波 器 处 理 ” ”最 小 值 泪 波 器 处 理 











人 











为 0， 方 差 为 
的 噪声 干扰 的 图 像 


站 人 0. 1 的 椒盐 噪 
登 加 ， 进 一 步 恶 化 


算术 均值 滤波 器 x 几何 均值 滤波 器 X 


Wi jd=5, 规格 为 5X5 的 修正 
后 的 阿尔 法 均值 滤波 器 
机 


中 值 滤波 融 





目 适 应 滤波 需 


e。 目 适应 滤波 内 


7 行为 变化 基于 由 mXn 和 矩形 窗口 S, 定义 的 区 域 
内 图 像 的 统计 特性 


v 与 前 述 滤波 夫 相 比 ， 性 能 更 优 

~ 但 也 增加 了 算法 复杂 性 

~ 包括 : 
> 目 适 应 、 局 部 噪声 消除 滤波 吉 
> 目 适 应 中 全 滤波 规 





目 适 应 滤波 项 

e 目 适 上 应、 局 部 噪声 消除 滤波 器 
滤波 吉 啊 应 基于 以 下 4 个 量 : 

~ gx y) ,表示 噪声 岁 像 在 点 〈x, y) 上 的 值 
“ oz ,go y) 的 噪声 方差 

~ 目 ， 在 $,, 上 像素 点 的 局 部 均值 

“ ol ,在 $,, 上 像 兹 点 的 局 部 方 关 








目 适应 滤波 器 

e 目 适 应 、 局 部 噪声 冰 除 滤波 侣 

滤波 亏 的 预期 性 能 如 下 : 

1， 如 果 只 三 0， 滤 波 器 返回 g(x, y) 的 值 。 
为 在 gx, y) 下 零 噪 声 的 情况 等 同 于 f (xy) 

2， 如 果 局 部 方差 与 o 高 相关 ， 滤 波 器 返回 
一 个 gx y) 的 近似 值 

3， 如 果 m =cz ， 滤 波 器 返回 区 域 $S,, 上 像素 的 
算术 均值 。 这 样 局 部 噪声 用 求 平 均 m 来 降低 





e。 目 适 应 、 局 部 噪声 消除 滤 流 货 
基于 上 述 假定 的 自 适 应 表达 式 : 





/se 六 又 BE 


了 


唯一 需要 知道 或 估计 的 未 知 量 是 噪声 方差 os 
其 它 参数 可 以 从 S, 中 的 像素 计算 出 来 








目 适 应 滤波 硕 举 例 


均值 为 0， 方 差 为 1000 的 高 斯 噪声 7X7 的 算术 均值 滤波 器 
5 oprraeacars mpeg pg TI 









工业 
FIGURE 5.13 人 
(a) Imase 人 人 
corrupted by 
additive Gaussian 【是 
nolse of zero 0 
mean and 
variance 1000. 
(b) Result of 
arithmetic mean 
filtering. 
{(c) Result of 
geometric mean 
filtering. 
(d) Result of 
adaptive noise 
reduction 
filtering.All filters 
Were of Size 
>X 


| 
半 






7X7 的 几何 均值 滤波 器 7X7 的 自 适 应 滤波 器 


。 目 适 应 中 全 滤 度 秀 


传统 中 值 滤波 圳 只 能 处 理 空 间 密度 不 大 的 
冲 激 噪 声 〈p , piK0.2) , 而 自 适 应 中 值 滤波 
人 厚 可 以 处 理 上 共有 更 大 概率 的 神 激 噪 声 


“ 可 以 在 平 请 非 训 激 噪声 时 保存 细节 ， 而 传 
统 中 值 尖 波 规 无 法 做 到 








W 


W 


W 


自 适应 中 值 滤波 器 ， 定 义 下 列 符号 


zin=Sy 中 灰 度 级 的 最 小 全 
Zu=S 中 灰 度 级 的 最 大 但 
2 中 灰 度 级 的 中 值 
z,, 二 在 坐标 〈x, y) 上 的 灰 度 级 
SS 允许 的 最 大 矿 才 








自 适 应 中 值 滤波 器 : 算法 
e 主要 目的 
~ 除去 “椒盐 ?噪声 《〈 训 诉 噪声 ) 
~ 平 请 其 它 非 冲 激 噪声 
~ 减少 物体 边界 细 化 或 粗 化 等 失真 








目 适应 中 值 滤波 堪 : 算法 
A 层 : 找到 一 个 非 脉冲 的 中 什 





2 满足 zkzusiKzuas， 转 到 B 层 ， 说 明 zusa 不 是 脉冲 






“C 现 果 A120 且 A2<0D 转 到 B 层 ， 否 则 增 大 窗口 尺寸 
如果 窗 口 尺 十 过 S， 重 复 A 层 ， 否 则 输出 z 。 
B 技 : 


满足 zuinczx《znax， 议 明 zx 不 是 脉冲 ， 输 出 zx， 
V B1=Z， 一 Znin 


说 明 zv 一 二 了 Qxy 一 2maxy》 输出 Zned 
V 0 


《如 果 B1>0 且 B2<0,) 输 出 ZX 否 则 和 输出 za 


目 适 应 中 值 滤 肖 规 举例 








P.=P,=0. 25 的 椒盐 噪声 7X7 的 中 值 滤波 器 SS， =7 的 自 适 应 中 值 滤波 器 


{ [ 到 4 E 人 人 人 
ss  _- 条 一 和 2 - 


训 其 * ”和 矢 “5 






< 人民 囊 出 


贡 | 陈 让 


FIGURE 5.14 (a) Imasge corrupted by salt-and-pepper nolse with probabllities 已 , = 品 = 0.23.(Pb) Result of 和 |- 
tering witha7 X7median filter.(c) Result of adaptive median filtering with Snax 三 7. 





图 像 复原 


e。 图 像 复原 的 频率 域 滤波 秀 
“ 市 阻 小 站 船 
” 市 通 滤波 从 
” 陷 波 泥 波 闪 
” 最 佳 陷 疲 滤 妆 秀 








二 
司 
1 有 

图 像 复 原 NLP 


e。 市 阻 滤波 吉 : 阻止 一 定 频 计 范 围 内 的 信 
号 通过 而 允许 其 它 频 率 范 围 内 的 信 忆 通 
过 ， 消 除 或 聚 减 全 里 叶 变 换 原 点 处 的 频段 


~ 理 息 市 阻 尖 妆 胡 
“ 巴特 添 思 市 阻 滤波 和 夫 
~ 局 斯 市 阻 滤波 从 








玖 
巩 
SS 
k 





会 | QQ 
十 
忆 
V| 
二 
>|w > la 
2 十 
宫 宫 
QQ vv 
_ 4 | 
王 > ~ 
示  。 己 
ba SS 
器 本 人 全 
|| 
让 全 
NA 
间 民 
和合 








图 像 复原 


e nf 引 的 巴特 添 思 市 阻 沽 波 器 
1 


中 | D Gy 吊 | 


D (ze,v)- D， 





媚 (xz,v)= 





。 出 期 市 阻 滤波 益 








市 阻 滤 疲 规 的 透视 图 








理想 ”巴特 添 思 ( 阶 数 为 ) ”高 斯 


FI 


mms 





55DI 它 


FIGURE 5.15 From left to right, perspective plots of ideal, Butterworth (of order 1),and Gaussian bandreject 
filters. 








市 阻 沽 波 表 使 用 举例 





被 正弦 噪声 污染 的 图 像 











4 阶 的 巴特 沃 思 带 阻 滤波 器 


该 图 像 的 传 里 叶 频 谐 








ab 
宙 间 


FIGURE 5.16 

(al) Imape 
corrupted by 
sinusoldal nolse. 
(bj) Spectrum of (ay). 
(c) Butterworth 
bandreject filter 
(white represents 
1).(d) Result of 
filtering. (Orioinal 
Image courtesy of 
NANSA.) 


图 像 复原 


。 市 通 滤波 上 船 : 允许 一 定 频 圣 范 围 内 的 信 
号 通过 而 阻止 其 它 频 率 范 围 内 的 信和 咏 通 过 


妇 p = 1 一 三 (oyj 





Hu v) 表 示 带 通 滤波 器 ， 瑟 (uv) 表示 相应 
的 带 阻 滤波 器 





图 像 复原 


e 陷 流 滤波 内 
~ 阻止 或 通过 事先 定义 的 中 心 频 率 邻 域内 的 频 
育 





~ 由 于 傅 里 时 变换 是 对 称 的 ， 陷 波 涛 小 需 必 须 
以 天 于 原点 对 称 的 形式 出 现 

~ 如 朱 陷 闵 泪 小 大 位 于 原点 处 ， 则 以 它 本 映 形 
却 出 现 





图 像 复原 








理想 的 陷 波 滤波 需 


五 ( 引 7) 









2 阶 的 巴特 沃 思 陷 波 滤波 器 ， ~“。 高 斯 陷 波 滤波 器 





了 


FIGURE 5.18 Perspective plots of (a) ideal.(b) Butterworth (of order2)j,.and (c) Gaussian 
notch (reject) filters. 





图 像 复原 





e。 理想 陷 波 市 阻 滤波 从 


0.D (Lvj< 记 或 广 (< 
Rosa 


中 心 在 《ua vo) 且 在 〈-uw -vo) 对 称 





图 像 复原 


e 巴特 斌 思 陷 流 市 阻 滤波 骨 
] 
瑟 (& 可 = 











] 十 Po 
DevjPzer 
e 局 斯 陷 波 市 阻 滤 疲 需 


2 D1 


注 : 当 uo=vo=0, 上 述 3 个 滤波 郁 变 为 高 通 滤波 山 





图 像 复原 





e 陷 妆 市 通 滤 六 人 秀 : 通过 包 侣 在 陷 流 区 的 
频率 


琳 ,让 =1- 囊 (oj 


“了 ku 7 是 陷 波 市 通 滤波 句 ， 芷 u v) 是 对 应 
的 陷 流 市 阻 滤波 项 


~ 当 uo=vo=0 时 ， 陷 流 市 通 滤 度 邢 变 为 低 通 尖 波 


记忆 








数字 图 像 处 理 〈7) 


任何 问题 ? 
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图 像 压 纵 


e。 基本 委 念 

e。 网 像 压缩 模型 
e。 信息 论 基础 
e。 无 损 压 缩 

e。 有 损 压 缩 

e。 网 像 压 缩 标准 
e 视频 压缩 标准 





图 像 压 纵 
e 基本 概 候 
~ 概述 
~ 数据 元 余 
> 编码 元 余 
> 像 系 间 元 余 
> 心理 视 党 元 余 
~ 图 像 体 上 度 和 质量 








图 像 压缩 

e。 为 什么 需要 图 像 压 缩 
~ 图 像 的 数据 量 通 章 很 大 ， 对 存储 、 处 理 和 传 
和 输 讲 来 许多 问题 〈 对 比 视频 ) 
~ 不 断 扩 大 的 图 像 应 用 

> Internet 上 的 大 量 图 像 

> 数字 图 书馆 

> 壮 感 图 像 

> 视频 ， 如 电视 会 议 、 数 字 电 视 、IPTV 





图 像 压 给 
e。 图 像 压 控 的 方法 


消除 元 余数 据 ， 从 数学 角度 看 ， 将 原始 图 像 
转化 为 从 统计 角度 看 尽 可 能 不 相关 的 数据 集 
~ 一 般 分 为 两 类 : 


> 无 损 压 控 : 在 压缩 和 解压 缩 过 程 中 没有 信息 损 





让 


> 有 损 压 绽 : 能 取得 较 高 的 压缩 率 ， 但 压缩 后 不 能 
通过 解压 缩 恢 复原 状 


> 其 它 : 如 根据 需要 ， 即 可 进行 无 损 ， 也 可 进行 有 
损 压 缩 的 扩 术 ; 准 无 损 扩 术 








图 像 压 绾 
e。 图 像 压缩 的 理论 基础 


~ 信息 论 
~ 图 像 处 理 的 概念 和 技术 
e。 压 方 法 
~ 预测 编码 方法 〈 对 应 空域 方法 ) 
~ 变换 编码 方法 〈 对 应 频 域 方法 ) 











图 像 压 纵 


。 效 据 元 余 的 概念 


数据 是 用 来 表示 信息 的 。 如 果 不 同 的 方法 为 表 
示 给 定量 的 信息 使 用 了 不 同 的 数据 量 ， 那 么 使 用 
较 多 数据 量 的 方法 中 ， 有 些 数 据 必 然 是 代表 了 无 
用 的 信息 ， 或 者 是 重复 地 表示 了 其 它 数据 已 表示 
的 信息 ， 这 如 是 数据 元 余 的 概念 。 





图 像 压 缩 
。 相对 数据 元 余 的 定义 《〈 续 ) 
如 条 ni 和 no 代表 两 个 表示 相同 信息 的 数据 集合 


中 所 携 载 信息 单元 的 数量 ， 则 mi 表示 的 数据 集合 
的 相对 数据 元 余 芭 定义 为 : 


RE 
CR 


CR 称 为 压缩 率 ， 定 义 为 


7 

_ ] 
人 一 

几 2 





图 像 压 纵 
。 相 对 数据 元 余 和 压缩 率 的 一 些 特例 


一 


第 1 种 表达 相对 第 2 种 表达 不 
余数 据 





nl >> n2 | 一 oo| 一 1| 第 1 种 数据 集合 包含 相当 多 的 元 
余数 气 


nl “《 n2 | 一 0| 一 oo| 第 2 种 数据 集合 包含 相当 多 的 元 
余数 据 








图 像 压 缩 
e 三 种 基本 的 数据 元 余 
~ 编码 元 余 
~ 像 系 间 元 余 
~ 心理 视觉 元 余 
e 如 末 能 减少 或 消除 上 述 三 种 了 见 余 的 1 种 或 
多 种 宛 余 ， 就 能 取得 数据 压缩 的 效果 








图 像 压 绾 
e。 什么 定编 但 几 余 ? 


如 果 一 个 图 像 的 灰 度 级 编码 ， 使 用 了 多 于 实 
际 需要 的 编码 符号 ， 就 称 该 图 像 包 含 了 编码 宛 人 


e。 黑白 二 值 图 像 编码 


如 果 用 8 位 表示 该 图 像 的 傣 系 ， 我 们 
怠 说 该 图 像 存 在 编码 见 余 ， 因 为 该 图 
像 的 像素 只 有 两 个 艾 度 ， 用 一 位 即 可 
表示 。 





编码 元 余 
e。 锋 像 百 方 图 的 定义 


pr)= 一 =012 .. 工 -1 


mk 古 第 k 个 灰 度 级 在 图 像 中 出 现 的 次 数 ，n 是 图 像 
的 像素 总 数 ; L 古 灰 度 级 数 。 


。 如 果 用 于 表示 每 个 r, 值 的 比特 数 为 1 fy ， 
则 表达 每 个 像 系 所 需 的 平均 比特 效 为 : 


,= 之 ip) 
表示 区 度 级 所 用 的 比特 数 和 大 灰 度 级 出 现 的 概率 相 
冬 








编码 拖 余 
。 对 MXN 的 图 像 进行 编码 所 需 的 比特 数 为 


上 MANL 


CLVS8 


e 人 参考 page 328 的 例 8. 1 








像素 间 元 余 
e 什么 是 像 际 间 元 余 ? 
~ 友 映 图 像 中 像素 之 间 的 相互 关系 
~ 因为 任何 给 定 像 际 的 值 可 以 根据 与 这 个 像素 
相 邻 的 像 了 尿 进行 预测 ， 所 以 单个 像 孙 携 市 的 信 
息 相 对 较 少 
~ 对 于 一 幅 图 像 ， 很 多 单个 像 了 尿 对 视 党 的 页 献 
是 见 余 的 。 它 的 值 可 以 通过 与 它 相 邻 的 像 际 值 
为 基础 进行 预测 

例 : 原 图 像 数据 : 234 223 231 238 235 

压缩 后 数据 : 234 -11 8 了 7 -3 








心理 视觉 元 余 
e。 什么 是 心理 视觉 元 余 ? 


~ 人 眼 感 党 到 的 图 像 区 域 完 度 不 仅 取决 于 该 区 
域 的 反射 光 ， 例 如 根据 马 攻 市 效应 ， 在 灰 度 值 
为 前 数 的 区 域 也 能 感觉 到 灰 度 值 的 变化 


~ 这 和 古 由 于 眼睛 对 所 有 视觉 信息 感受 的 灵敏 度 
不 同 。 在 正 负 视觉 处 理 过 程 中 各 种 信息 的 相对 
重要 程度 不 同 

~ 有 些 信 息 在 通 利 的 视觉 过 程 中 与 万 外 一 些 信 
恩 相 比 并 不 那么 重要 ， 这 些 信息 梓 认 为 是 心理 
视觉 元 余 的， 去 除 这 些 信息 并 不 会 明 有 降 低 锋 
像 质量 








由 于 消除 心理 视觉 元 余数 据 会 寻 致 一 定量 信息 的 丢 
失 ， 所 以 这 一 过 程 通 负 称 为 量化 

心理 视觉 元 余 压 缩 是 不 可 恢复 的 ， 量 化 的 结 东 导致 
了 数据 有 损 压 腑 


GRID 








你 真 度 准则 


e。 剑 上 度 准 则 
~ 网 像 压缩 可 能 会 导致 信息 损失 ， 如 去 除 心 理 
视觉 几 余 数据 
” 需要 评价 信息 损失 的 测度 以 摘 述 解 但 图 像 相 
对 于 原始 图 像 的 偶 离 程度 ， 这 些 测 度 称 为 保 真 
度 准 则 


~ 负 用 保 真 度 准则 分 为 两 大 类 : 
> 客观 傈 真 度 准 则 
> 主观 傈 真 度 准则 








你 真 度 准则 


。 各 观 你 真 度 准 则 


~ 当 所 损失 的 信息 量 可 以 用 编码 输入 图 像 与 编 
人 码 输 出 图 像 的 函数 表示 时 ， 它 就 是 基于 客观 保 
真 度 准 则 的 


~ 和 角 用 的 两 种 客观 保 真 度 准 则 
> 均 方 根 误 天 
> 均 方 信 品 比 








客观 保 真 度 准 则 


。 输 入 图 和 输出 图 之 间 的 均 方 根 误差 
v 令 /tey 代表 输入 图 ，jtey 代表 对 Fly 先 压 
缩 后 解压 缩 后 得 到 的 fley) 的 近似 ， 则 fley 和 
fl 让 之 间 的 误差 定义 为 

ecy)= Co y)- Co y) 
如 两 幅 图 像 尺 寸 均 为 MXN， 则 它们 的 总 误差 为 


之 过 /Gey] 











客观 保 真 度 准 则 


e 输入 岁 和 输出 图 之 间 的 均 方 根 误 关 
~ 这 样 Fey 和 As 之 间 的 均 方 根 误差 为 





心理 视觉 元 余 








输出 图 的 均 方 信 噪 比 
7 如 果 将 Jtxy 看 作 原始 图 /xy 和 噪声 信号 dy 
的 和 ， 那 么 输出 图 的 均 方 信 噪 比 本 

SNVR ， = 羡 7Ge 下 让 下 re 


均 方 根 信 噪 比 SNR ,为 





M -LN-l 和 hM -LN=-LIf 和 ^ 2 
SNR = >》， 广 (xy 入 浊 ， | re 
X=0 y=0 x=0 y=0 








主观 保 真 度 准 则 


1 攻 如 同人 想象 出 的 最 好 


质量 


2 民 好 “| 图 像 质 量 局 ， 观 看 罕 服 ， 有 干扰 但 不 影 
啊 观 看 


3 可 用 | 图 像 质 量 可 接受 ， 有 干扰 但 不 太 影 响 观 
看 


刚 可 看 | 图像 质量 差 ， 干 扰 有 些 妨碍 观看 ， 希 望 
改进 


图 像 质 量 很 关 ， 妨 但 观看 的 干扰 始终 存 


在 ， 几 乎 无 法 观看 


6 | 不 能 用 图 像 质 量 极 差 ， 不 能 使 用 










图 像 压 缩 模型 


e。 图 像 压 缩 模 型 














图 像 压 缩 模型 
。 信 激 有 顷 但 天 


信 源 编码 圳 
~ 信 源 编码 器 : 减少 或 消除 输入 图 像 中 的 编码 见 余 、 像 素 
间 宛 余 及 心理 视 党 元 余 
~ 转换 器 : 减少 像素 间 隐 余 
~ 量化 器 : 减少 心理 视觉 见 余 ， 该 步 操 作 是 不 可 逆 的 
~ 符号 编码 器 : 减少 编码 元 余 


~ 并 不 是 每 个 几 像 压 纺 系统 都 必须 包含 这 3 种 操作 ， 如 进 
行 无 误差 压缩 时 ， 必 须 去 掉 量 化 器 


图 像 压 缩 模 型 
e。 信 浙 解 公 表 


反 向 转换 器 (cy 


信 源 解码 天 





~ 符号 解 权 郁 : 进行 符 亏 编 但 的 刻 操作 
~ 反 同 转换 蕉 : 进行 转换 共 的 逆 操 作 
~ 为 什么 没有 反 同 量化 郝 ”? 





图 像 压 缩 模型 


。 信 道 编码 器 和 信道 解码 器 

信道 是 有 噪声 的 或 易 产生 误差 时 ， 信 道 编码 器 
和 信道 解码 器 对 整个 编 解码 过 程 非常 重要 

由 于 信 源 编码 器 的 输出 数据 一 般 只 有 很 少 的 宛 
余 ， 所 以 它们 对 输出 噪声 很 敏感 

v， 汉 明 (Haming) 编码 :在 编 了 码 的 码 字 后 面 增 
加 足够 的 比特 位 以 保证 各 个 正确 的 码 字 之 间 至 少 
有 一 定数 量 的 比特 位 不 相同 








图 像 压 纵横 型 
针 信息 论 基 础 
~ 显示 一 幅 图 像 需要 多 大 的 数据 量 ” 有 没有 描 
述 一 幅 图 像 且 没有 信息 丢失 的 最 小 数据 量 ” 
懈 信息 测量 
~ 对 一 个 随机 事件 E， 如 果 它 的 出 现 概率 是 
P(B) ,那么 它 包含 的 信息 : 
ee 
TIE) 称 为 E 的 自信 息 。 如 果 P(GE)=L( 即 事件 总 发 
生 ) ， 那 么 LAE) =0 








图 像 压 缩 模型 





@ 信息 信 言 道 





EnseTnbje【 志 . 王 ) Enmsemmb 关 [ 吾 . 人 
此 = 芭 吧 = [gj 旦 = 人 8 
下 一 [下 一 [人 的 证 


信道 是 连接 信 源 和 用 户 的 物理 媒介 。 它 可 以 是 电话 
线 、 无 线 传 播 、 导线 或 intefrnet 





信息 论 基 础 


e。 信 源 
~ A=tay az …, aijj 称 为 信 源 字母 表 
” 信 谣 产生 符 志 aij 的 事件 概率 是 P(aji), 且 
> 


v 一 个 J 勾 1 向 量 z=laajaaohPo 用 于 表示 所 有 
信 源 符号 的 概率 集合 


~ 有 限 总 体 集 合 人 A, z) 完全 摘 述 了 信息 源 





信息 论 基础 
。 信 源 〈 续 ) 
~ 如 果 产 生 k 个 信 源 符号 ， 则 大 数 定律 保证 对 于 一 个 


充分 大 的 k， 符 号 a 将 被 输出 KP (a ) 次 。 因 此 ， 根 据 k 
输出 得 到 的 平均 自信 息 是 


-DA jiogPla 】 
~ 每 个 信 源 输出 的 平均 信息 ， 也 称 为 信 这 的 业 为 


鼠 (z)= 了 po)osg Po 





~ 如 采信 这 符 气 的 出 现 是 等 可 能 性 的 ， 则 上 述 精 被 荫 
大 化 ， 此 时 信 谣 拥 供 最 大 信息 量 








信息 论 基 础 
e 信道 输出 

v B-={b,,b, .bj 称 为 信道 字母 表 

~ 提交 给 用 户 的 字符 bl 的 概率 是 Pb 
~ 有 限 集合 B, w) 完整 朱 述 了 信道 输出 和 用 户 
~ 给 定 信 道 输出 概率 P(b.) 和 信 源 符号 概率 
P(a) ,它们 由 下 式 相 联系 

P(D)= > PC [oj)P(e 


J =1 








信息 论 基 础 


。 信 填 输 出 《〈“ 续 ) 


~ 将 上 式 中 的 条 件 概率 放 入 一 个 KXJ 的 正 同 信 
道 传 递 矩 阵 Q， 其 元 素 quj=P (baj) 为 条 件 概 率 


Po) P 人 10) 和 P 人 |a7) 
P(O|a) P( |o) P(o |o7) 


O = 


posla) pola) Psla 


“ 则 输出 符 气 集 的 概率 分 布 由 下 却 计 算 
7 = @x 








信息 论 基础 
e 条 件 依 函数 开 (z bb) 

HClo)=- 袜 Please 人 
。 条 件 概率 HH(zlv) 


HClI= RCIJPO 


下 


驻 Ple， | 玉 )P( log P(a， 记 j 


= -六 yp 和 沁 )ios Po， 六 】 


CT 
| 
一 








言 息 论 基础 
e。 因为 两 个 事件 C 和 D 的 联合 概率 是 


ARCD=aclIDPD=RADIORO 
。P(a ) 的 变换 〈 下 面 推导 互信 息 使 用 ) 
Haj=Poej+Pa HH 


-2 
e 定义 信道 传输 元 聚 


df 太 = P 亿 | oj 








也 





ji 
是 | 驯 

本。 
和 | 三 
-全 
1 发 
撕 NN 

民 








信息 论 基 础 
一 女 Pa ,已 ) 
1 六 Pi 六 jos PC 


| 忆 \a ， 





信息 论 基础 
e 开 信 息 总 结 


~ 互信 息 T\z, 是 信 源 符 号 概率 问 量 2 和 信道 
官 阵 Q 的 冰 数 


~ 当 输 入 和 输出 符号 统计 独立 时 ，I(z, v) 取得 
最 小 信 0 

~ 工 z, V) 对 所 有 信 源 分 布 u 的 最 大 值 吏 是 信道 
容量 人 全 max[ree 

~ 信道 容量 定义 了 能 够 通过 信道 可 对 地 传送 信 
轧 的 最 大 传送 座 








信息 论 基 础 

e。 基本 编码 定理 〈 自 学 ) 
“ 无 噪声 编码 定理 
~ 噪声 编码 定理 

~ 信 源 编 伺 定理 





信息 论 基 础 
e 无 误差 压缩 
~ 变 长 编码 
> 霍 夫 曼 (Huffman) 编码 
有 其它 变 长 编码 
> 算术 编码 
~ LZ8W 编 码 
~ 位 平面 编 伍 
~ 无 损 预 训 编 码 





无 误差 压缩 
。 无 误差 压缩 的 必要 性 


在 医疗 或 商业 文件 的 归档 ， 有 损 压 缩 因为 法 律 原 因 
而 被 花 


~ 卫星 成 像 的 收集 ， 考 虑 数据 使 用 和 所 人 花 强 用 ， 不 和希 
记 有 任何 数据 损失 


~ X 光 拍 族 ， 信 息 的 丢失 会 导致 诊断 的 正确 性 
e。 无 误差 压缩 技术 

~ 减少 像 系 间 元 余 

” 减少 编码 元 余 








无 误差 压缩 


e 变 长 编码 
”减少 编 但 元 余 


“ 变 长 编码 ， 即 把 最 短 的 码 字 赋 了 予 出 现 概率 最 大 的 
灰 度 级 


1， 将 需要 竹 碟 的 符号 概率 排序 ， 并 将 最 低 概 率 的 符 扎 
联络 为 一 个 单一 符 扎 

2， 对 每 个 化 徐 后 的 信 源 进行 编码 ， 从 最 小 的 信 源 开 
台 ， 一 直 编 码 到 原始 的 信 源 





霍 天 受 编 但 








步骤 1 


Original SoUrce Source reduction FIGURE 8.11 
Hufftman source 
Symbol Probability 2 3 4 reductions. 


0.4 0.4 0.4 0.6 
0.3 0.3 0 0.4 


0.1 0.2 四 3 
0.1 | 





步骤 2 


FIGURE 8.12 Original SOUrce Source reduction 

Huffman code 

assignment 1 六 3 4 
procedure. 


0.4 1 0.4 1 04 1 0.6 0 
0.3 00 0.3 00 0.3 0 04 1 


0.1 0ll 0.2 010 0.3 01 
0.1 0100 0.1 011 

01010 0.1 0101 

01011 








霍 天 受 编 但 


解码 通过 查询 表 的 方式 完成 


例 : 入 0 


qa3 ”dl qd2d236 


如 








霍 夫 曼 编码 
。 其 它 接近 最 佳 的 变 长 编码 ;为 什么 需要 ? 


V 





当 对 大 量 符号 进行 编码 ， 构 造 霍 夫 曼 编 码 比 
较 复 杂 

对 JJ 个 信 源 符号 ， 需 要 进行 六 2 次 信 源 化 简 和 
六 2 次 编码 分 配 

对 256 个 灰 度 级 图 像 ， 需 要 254 次 信 源 化 简 和 
254 次 编码 分 配 

考虑 牺牲 编码 效率 以 减少 编 但 构造 的 复杂 性 





算术 编码 
。 算术 编 但 


“ 从 整个 符号 序列 出 友 ， 采 用 递 推 形式 连续 纲 
但 


在 算术 编码 中 ， 源 符号 和 码 字 间 的 一 一 对 应 
关系 并 不 存在 。1 个 算术 码 字 要 赋 给 整个 信 源 
符号 序列 ， 而 码 字 本 喘 确定 0 和 1 之 间 的 1 个 实 
数 区 间 

随 着 符号 序列 中 的 符号 数量 增加 ， 用 来 代表 
它 的 区 间 减 小 而 表达 区 间 的 信息 单位 数量 变 
大 





算术 编码 


Source Symbol 


Encoding Sequence 一 一 一 办 
4 4 


2 


0. 04=0+(0. 2-0)/5X1 
0. 08=0+(0. 2-0) /5 色 2 


Probability 








Initial Subinterval We 
Arithmetic coding 


example. 


FlICURE 8.13 
Arithmetic coding 
procedure. 


0.06752 


0. 056=0. 04+(0. 08-0. 04) /5 义 2 
0. 072=0. 04+(〈0. 08-0. 04) /5 X 4=0. 04+0. 032 





LZW 编 码 


e。 工 必 纺 码 : 消除 像 了 系 间 元 余 


~ 是 由 Lemple 和 Ziv 最 早 提 出 ， 然 后 由 Welch 充 
实 的 有 专利 保护 的 LZW 算 法 


“ 将 原始 数据 中 的 重复 字符 串 建 立 一 个 字 串 
表 ， 然 后 用 该 重复 字 串 在 字 串 表 中 的 索引 桨 
代 原 始 数据 达到 压 缩 的 目的 


“ 一 个 由 8 位 组 成 的 文件 可 以 被 编 成 12 位 的 代 
僻 。 在 22 王 4096 个 可 能 的 代码 中 ，28 王 256 个 
代表 所 由 可 能 的 单个 字符 〈8 位 ) ， 剩 下 的 
3840 个 代码 分 配给 压缩 过 程 中 出 现 的 字符 虽 








LZW 编 码 


e LZW 编 码 〈 续 ) 

每 当 表 中 没有 的 字符 串 第 一 次 出 现时 ， 写 融 
委 原 样 保 存 ， 同 时 将 分 配给 它 的 代码 也 保存 

“ 之 后 ， 当 这 个 串 再 次 出 现时 ， 只 将 它 的 代码 
保存 ， 这 吏 去 择 了 文件 元 余 信 息 

不 但 字符 串 表 是 在 压缩 过 程 中 动态 生成 ， 而 
且 字 符 串 表 也 不 必 保 存在 压缩 文件 里 ， 因 为 
解压 缩 算法 可 以 由 压缩 文件 中 的 信息 重 构 


~ 使 用 LZW 的 文件 格式 包括 GIF，TIFF 和 PDF 等 。 





LZW 编 码 例子 


一 个 4X4、 8 位 图 像 - 39 120 120 








e 一 个 512 字 让 的 字 熏 





LZW 编 码 例子 





Currently 


Recosnized Pixel Being Encoded 
Seduence Processed Outpnut 


Dictionary TAB 3.7 
Location LZW coding 
(Code Word) 。 Dictionary Entry example. 


39 56 39-39 
39 97 em 9126 
126 : 126-126 
126 126-39 
39 39-39 
39-39 6 5 


30-39-126 
126-126 
DAN 126-1206-39 
人 
39-39-126 2 260 202 30-39-120-126 
126 126-39 
126-39 》 263 1]26-39-39 
39 
30-126 
126 








位 平面 编 公 
e。 位 平面 编码 : 消除 像 妹 间 元 余 


“ 将 一 幅 图 像 分 解 为 一 系列 二 值 图 像 并 通过 二 
值 图 像 压 缩 方法 对 每 幅 二 值 图 像 进行 压 纵 


“ 位 平面 分 解 的 两 种 方法 
> 二 人 图 像 位 平面 
> 灰 上 度 编 但 位 平面 








位 平面 编码 





e。 二 信和 网 像 位 平面 


V 


一 幅 m 比 特 的 区 度 赂 像 具 有 的 灰 度 级 表示 如 下 


1 一 | 1 一 2 ] 0 
站 


111 一 | 


零 级 位 平面 是 通过 收集 每 个 像 际 的 au 位 生 
成 ， 第 m-J) 级 位 平面 包含 a 位 

缺点 : 图 像 在 灰 度 级 上 稍 有 变化 就 会 对 位 平 
面 的 复杂 性 产生 显著 影响 ， 如 亮度 127 
(01111111) 和 亮度 128(10000000) 的 转换 





位 平面 编 公 
。 灰 度 编码 位 平面 
“ 图 像 的 灰 度 编码 根据 下 列 方 法 得 到 ; 


So-l 一 人 -1 
8 =0 由 0 0<I<m-2 


“ 避免 二 值 图 像 位 平面 的 问题 ， 连 续 码 字 只 在 1 
位 位 置 上 不 同 , 如 亮度 127 (01000000) 和 亮度 
128(11000000) 的 转换 








位 平面 编码 一 例 


8 比特 单 色 图 像 








二 值 图 像 





Ac 2YTVCQtCACLLALN TaiCfVY AL A2LdL a hb 
zt/cCrctL OULALAprlh 





FIGURE 8.14 AA 
1024 X 1024 

(al) 8-bit 
monochrome 
Imasge and 

(b) binary Imase. 


位 平面 编码 一 一 例 
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本 习 舍 
飞 开 前 勤 油 对 


到 愉 公 惑 函 











去 
| 
下 
基 
二- 
世 | 





位 平面 编码 

e。 位 平面 分 解 方法 总 结 

“ 低位 面 图 比 高 位 面 图 复杂 ， 即 低位 面 多 比 高 
位 面 狗 包 丘 的 细 要 多 ， 也 更 随机 


“ 灰 度 编 但 表达 的 位 面 多 复杂 度 较 低 ， 但 具有 
视 沉 意义 信息 的 位 面 图 数量 更 多 





位 平面 编码 
。 季 数 据 编 但 
“ 用 专门 的 码 字 表达 全 是 0 或 1 的 连通 区 域 


~ 将 图 像 分 成 全 黑 ， 全 和 白 或 混合 的 mXn 尺 寸 的 
块 。 出 现 频率 最 高 的 类 赋予 1 位 但 字 0， 其 它 2 
类 分 别 赋予 2 位 码 字 10 和 11 

~ 由 于 诛 来 希 用 mn 比特 表示 的 稍 数 块 现在 只 用 1 
位 或 2 位 表示 ， 这 样 承 达到 了 压缩 的 目的 


赋予 混合 块 的 码 只 是 作为 前 缀 ， 后 面 还 需 跟 
上 衣 块 的 用 mn 位 表示 的 模式 








位 平面 编码 
e。 季 数 块 编 僻 《〈 续 ) 


当 珊 压缩 的 图 像 由 昌 色 部 分 组 成 时 《如 文 
档 ) ， 可 将 日 色 区 域 编 为 0， 其 它 匡 用 1 接 上 
该 据 的 位 模 陈 编 但 

“ 改进 共 法 : 将 二 值 图 或 位 平面 友 代 地 分 解 成 
矿 寸 越 来 越 小 的 子 块 。 如 采 子 块 不 是 全 日 ， 
继续 分 解 ， 二 至 茶 个 事先 确定 的 于 块 矿 二。 
如 条 最 后 子 块 全 日 ， 惑 编 为 0， 反 之 编 为 1 加 
上 该 块 的 位 模 坯 





位 平面 编 但 
。 一 维 行程 编 但 
“ 用 一 长 度 序列 表示 图 像 或 位 平面 的 每 一 行 ， 这 些 长 度 


ee 
“ 征 传 真 编码 的 标准 压缩 方法 
“ 对 从 元 到 右 扫 朱 一 行 时 所 遇 到 的 1 或 0 的 连接 组 ， 便 用 
这 些 连 接 组 的 长 度 进行 编码 
~ 决定 行程 长 度 值 的 单 用 方法 : 
> 指定 每 一 行 第 一 次 行程 的 值 
> 假设 每 一 行 从 白色 行程 开始 ， 这 次 行程 的 长 度 可 














无 损 预 测 编码 


。 了 预测 编 但 的 葵 本 中 外 

“ 通过 仅 握 取 每 个 像 系 中 的 新 信息 并 对 它们 顷 
但 来 请 除 像素 间 的 见 余 

“ 1 个 像 系 的 新 信息 定义 为 该 像 系 的 当前 值 与 预 
测 值 的 关 

“ 正 是 由 于 像 系 间 有 相关 性 ， 所 以 才 使 预测 成 


为 可 能 





无 损 预 名 编码 
。 无 损 预 测 纺 解 但 系统 


8 7 


hb Inpnut 
integer ja 
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FIGURE 8.19 和 
lossless predictive 
coding model: 
(aj encoder': 


(bj decoder， 
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无 损 预 测 编码 EC 

当 输 入 网 像 的 像素 序列 引 逐个 进入 编码 器 ， 预 测 器 根据 
过 去 的 输入 产生 当前 和 输入 像 隶 的 估计 值 。 预 训 磺 的 输出 
舍 入 成 最 近 的 整数 六 并 梓 用 来 计算 预测 误差 

全 归 

”该 误 状 用 符 气 编码 右 信 助 变 长 但 进行 编 但 以 产生 压缩 数 
据 流 的 下 一 个 元 系 。 然 后 解码 夯 根 据 接收 到 的 变 长 码 字 
重建 ee， 并 执行 下 列 操作 








无 损 预 测 编码 


“ 一般 情 况 下 ， 可 将 m 个 先前 的 像 陛 进行 线性 组 合 以 得 到 预 
训 








人 = 7OV1Q 二 
和 FOLTIC ar,y 一 中 


1 一 1 
其 中 ， m 是 线性 预测 磊 的 阶 ， round 是 含 入 国 数 ， ai 古 扳 
训 系 数 


“ 了 节 简 单 的 一 维 线性 预测 编码 是 一 阶 〈m=1) ， 些 时 
有 = 1od |ar (xy=-1)| 








数字 图 像 处 理 〈8 ) 


任何 问题 ? 
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图 像 压 纵 


e。 基本 概念 

e。 网 像 压 缩 模型 
e。 信息 论 基 础 
e。 无 损 压 绾 

e 有 损 压 绾 

e。 岁 像 压缩 标准 
e。 视频 压缩 标准 








有 损 压 缩 
。 人 概述 
~ 牺牲 图 像 复 原 的 准确 度 以 换取 压缩 能 力 的 增 
加 


7 如 果 产 生 的 失真 可 以 容 及 ， 则 压缩 能 力 的 增 
加 是 有 效 的 








有 损 压 缩 CO 
e@ 有 损 预 测 编码 : 直接 对 像素 在 图 像 空间 进行 操作 , 称 为 
空域 方法 

~ 有 损 预测 编码 系统 

~ 最 优 预测 器 

~ 最 优 量化 
e。 变换 编码 : 基于 图 像 变换 的 编码 方法 ， 称 为 频 域 方法 

~ 变换 编码 系统 

~ 变换 选择 

~ 子 图 像 尺 寸 选 择 

~ 比特 分 配 








有 损 预 测 编码 系统 
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有 损 压 给 


e。 有 损 预 测 编 但 系统 


~ 量化 器 插 在 符号 编码 器 和 预测 误差 产生 处 之 
闻 ， 把 原来 无 损 编码 器 中 的 整数 舍 入 模块 吸收 
了 进来 

~ 量化 器 将 预测 误差 映射 进 输出 。 中 ,e 确定 
了 有 损 预 测 编码 中 的 压缩 量 和 失真 量 


~ 反馈 环 的 输入 是 过 去 预测 和 与 其 对 应 的 量化 
误 兰 的 函数 





OA 





有 损 压 给 


。 了 最 优 预 测 从 


v 在 绝 大 多 数 预测 编码 中 用 到 的 最 优 预 测 器 在 
满足 限制 条 件 


太 ,=ed+jse+ 太 = 太 
广 > 00ij 太 ， 
的 情况 下 能 最 小 化 编码 器 的 均 方 预 训 误 天 


= 名 -可 -| 








有 损 压 缩 

e 最 优 预 测 堪 〈 续 ) 
~ 最 优 准 则 是 最 小 化 均 方 预 出 误 关 ， 设 量化 误 
差 可 以 忽略 〈:, - 。) ， 并 用 m 个 先前 像素 的 线 
性 组 合 进 行 预 测 

~ 上 述 限 制 并 不 是 必需 的 ， 但 它们 都 极 大 地 人 简 
化 了 分 析 ， 也 减少 了 预测 喜 的 计算 复杂 性 

~ 基于 上 述 条 件 的 预测 编码 方法 称 为 兰 值 脉冲 
码 调制 法 〈DPCM) 

~ 最 优 预 测 喜 设 计 的 问题 简化 为 比较 直观 地 选 
择 m 个 预测 系数 以 最 小 化 下 式 的 问题 : 








有 损 压 给 


e。 最 优 预 出 秦 〈 续 ) 





有 损 压 给 


e。 最 优 预 出 秦 〈 续 ) 


并 假设 用 1 个 4 阶 线性 预测 需 : 








人 


来 预测 
v 通 利 ， 预 测 系数 的 和 要 小 于 或 等 于 1。 即 


11 
>》 ali <] 
1=1| 








有 损 压 给 


e。 最 优 预 出 共 《〈 续 ) 


Qi 和 | 


iv 


上 述 限 制 是 确保 预 训 硕 的 输出 能 够 洲 到 灰 度 级 的 允 
许 范 围 内 

减少 传输 噪声 的 影响 

” 减 小 DPCM 解 码 磺 对 输入 噪声 的 敏感 性 是 很 重要 的 ， 
因为 单个 差错 会 传播 到 所 有 以 后 的 输出 。 这 样 ， 解 码 
希 的 输出 会 变 得 不 稳定 








例 :， 预测 技术 的 对 比 

e@ 考虑 对 单 色 图 像 进行 DPCM 编 码 产 生 的 预测 误差 
。 假 设 量化 误差 为 0， 即 e, =e 

e 定义 下 列 4 个 预测 器 ， 并 使 用 其 中 1 个 : 


人 


Hey7=0971ey 下 
1 X] =051(xy-U+0SHx-Ly 


天 
Hz =0751(x yy-U+075HLxz 开 DJ-05HLx-L7 一 1 
, 司 司 | WU 
“oo 其它 
水 平 梯度 垂直 梯度 





例 ; 预 负 技术 的 对 比 








FIGURE 8.23 和 
S12 X S12 8-bit 
monochrome 
1masge. 





例 ， 预 负 技术 的 对 比 


| 





汪 用 


Ca 
FIGURE 8.24 和 
comparison of 
four linear 
prediction 
technliques. 

(4 

CA 





结论 : 随 春 预 测 孝 阶 数 的 增加 误差 减少 了 


有 损 压 给 
。 了 节 优 星 化 


Outpnut [ FIGURE 8.25 和 
tyVplcal 
duantization 
function， 











v t=dq(s) 是 Ss 的 奇 郴 数 


~ 断 点 定义 了 图 数 的 不 连续 性 ， 被 称 为 量化 磺 的 判 次 和 重 
构 级 








有 损 压 缩 
。 最 优 量化 


“ 量化 器 的 设计 就 是 要 在 给 息 优化 准则 和 
输入 概率 密 虚 函数 p(s) 上 的 条 件 下 选择 最 
优 的 s; 和 t,, 优化 准则 可 以 是 统计 的 或 心 
理 视 党 的 准则 

~ 如 果 用 最 小 均 方 量化 误差 不 -j 作 
为 准则 ， 且 p(s) 是 个 介 函 数 ， 那 么 最 小 
误 兰 条件 为 











| -opGsjas =0 


中 判定 层 在 重 构 层 之 间 的 一 半 处 





攻 ;二 0 是 一 个 奇 函数 的 结果 


恋 


对 于 任意 的 L， 满 足 上 列 公 式 的 si 和 ft 在 均 方 误差 意 义 下 是 最 佳 的 ; 
相应 的 量化 需 称 为 L 层 的 Lloyd-Max 量 化 硕 








TABLE 8.10 人 

Liovyd-Max ; 

duantizers fora 

Laplacian co 0.707 1.102 
probabllity 


density function 
of unilt Variance. 





1 1 一 | 








最 优 量化 
@ 总 2 
“ 实际 应 用 表明 ，2 级 量化 侨 所 产生 的 由 于 冬 率 过 载 而 造成 
的 解码 图 中 边缘 模糊 的 程度 比 4 级 和 8 级 量化 器 的 程度 要 高 
“ 具有 步 长 6 的 最 优 均 匀 量 化 夯 在 具有 相同 输出 可 靠 性 的 
条 件 下 能 提供 比 固定 长 度 编 码 的 Lloid-Max 量 化 帮 更 低 的 码 
率 
“ Lloid-Max 量 化 厚 和 最 优 均匀 量 化 融 都 个 是 目 适 应 的 ， 但 
如 果 根 据 图 像 局 部 性 质 调解 量化 值 也 能 提供 效率 
~ 可 以 较 细 量化 绥 慢 变化 区 域 而 较 粗 量化 快速 变化 区 域 。 
这 可 同时 减少 箱 粒 噪声 和 笠 率 过 载 ， 且 码 率 增 加 很 少 


“ 这 也 会 增加 量化 礁 的 复杂 性 














量化 和 复原 例子 :DPCM 结 果 图 像 
使 用 3 阶 预 测 器 Atej-073(ey-jH073(eD 0srelo 
2 层 L1oyd-Max 量 化 器 E 目 适 应 量化 方法 : 


在 4 个 可 能 的 量化 器 
中 选择 最 好 的 一 个 





4 层 Ll1oyd-Max 量 化 需 ， 只 


叶 , 二 








8 层 Lloyd-Max 量 化 器 








量化 和 复原 例子 :标定 过 的 DPCM 结 果 图 像 








图 a 图 图 图 d 图 e 图 ff 


TABLE 8.11 
Lloyd-Max Quantizer Adaptive Quantizer 天 
| Tossy DPCM 
Predictor 2-level 4-level 8-level 2-level 4-level 8-leyel root-mean-Square 
TTOT SUmImSaTV. 
Eq.(8.5-16) 30.88 0 ， 


Eq. (8.5-17) 14.59 
Eq.(8.5-18) 9.90 
Eq. (8.5-19) 38.18 





Co11apresyio 8.001:1 4.00:1] 


~ 图 a 到 f 中 天 弄 图像 的 rms 误 产 

~ 注 明 了 不 同 的 预测 器 和 量化 颖 

~ 2 层 目 适 应 量化 妖 的 均 方 误差 与 4 层 Lloyd-Max 量 化 右 相 近 
“ 4 层 自 适应 量化 器 的 均 方 误差 小 于 8 层 Lloyd-Max 量 化 器 








有 损 压 纵 


。 变换 纺 码 
“ 基于 岁 像 变换 的 编码 方法 


~ 用 可 逆 的 线性 变换 《〈 如 传 里 时 变换 ) 将 图 像 
映射 成 1 组 变换 系数 ， 然 后 将 这 些 系数 量化 和 
编码 


~ 大 多 数 图 像 变换 得 到 的 系数 值 都 很 小 ， 这 些 
系数 可 以 较 粗 地 量化 ， 或 忽略 不 计 

” 虽然 失真 很 小 ， 信 息 仍 然 不 能 完全 复原 ， 所 
以 还 是 有 损 压 缩 





变换 编码 系统 








子 图 分 解 ”变换 量化 编码 
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FIGURE 8.28 Atranstorm codinsg System: (a) encoder': (b) decoder. 









变换 选择 2 
e 考虑 大 小 为 NXN 的 网 像 fx, y) ， 该 图像 的 正 回 
离散 变换 T(u, v) 表示 为 

Ttw = > (cy)jgeoa 
uv=0, 1, 2, ...,N-1。 给 定 Tu v ,fx,y) 可 用 离 
散 反 杰 换 得 到 

je= 半 Tea 


WU=0 v=0 


X, y=U, 1 2，...,N-1 
gx yu v) 和 h (x, y, uv) 分 别称 为 正 同 和 拷问 变换 核 函 数 








变换 选择 从 
e 如 果 下 列 等 陈 成 也 ， 正 回 核 图 数 gx, yu v) 称 为 


是 可 分 离 的 
gc 加 J=gCoczjg On 


如 末 g1 在 函 区 下 十 o， 则 核 函 数 是 对 和 彩 尔 的 


gotT=gi(cagiOn) 


如 有 末 上 述 等 式 对 逆 同 核 玫 数 hx, yu, v) 成 也 ， 
则 hx, yu v) 也 具有 上 述 结 论 








变换 选择 SA 
e DFT 变换 《离散 传 里 时 变换 的 简化 厂 本 MEN) ) 





一 / 27z(zx+vy)/ AN 


] 
sg 人 2， J2520TY 一 


了 27z(zx+Hvy)/ AN 


jx， 也 ,24， y 尝 记 


e@ WHT 换 


1 
sg 人 2， 也 ,24， y) 莹 jx， 也 ,14， y) 萱 本 





WHT 变 换 
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。WHT 的 重要 意 文 : 所 有 核 的 值 均 为 1 或 =T 实现 上 简单 

e N=4 时 的 核 ， 每 个 顽 包括 4X4 三 16 个 子 方块 

e 和 白色 表示 十 1， 而 黑色 表示 一 1 

e 左上 角 的 块 : u=v=0, x, y=0, 1 2, 3 时 g(x, v, 0, 0) 的 值 : 十 1 
e 左上 第 二 霹 : u=0, v=l, x, y=0, 1 2, 3 时 g(x, v 0, 1) 的 值 








变换 选择 

。DCT 变 换 〈 离 散 余 弦 变 换 ) 
一 维 DCT 变 换 及 反 变 换 
r()=e( 六 jco| 2 01. N_1 


1 人 = 于 (JrJeo 2 -01 N_1 


四 w\VJ1/ N 当 x =0 
CU /三 
w\VJ1/N 当 x =12...N-1 








变换 选择 
e。 DCT 变 换 《〈 离 散人 余弦 变换 ) 
~ 二 维 DCT 变 换 及 反 变 换 ， 
后 Cxz+lUiz|、|Cxz+D 
Tu = alujaulv 这 二 je oj 守 上 | 








2N 
UV 三 0U1...,NV 一 | 


-Soybjrtja eye|es 


X7 = 由 AN 一 1 















FIGURE 8.30 Discrete-cosine basis functions for N = 4. The orisin of each block is at its 
top left. 


e gg 的 人 不 是 整数 
e 0 为 黑 ，1 为 日 ， 较 大 的 g 值 ， 对 应 较 浅 的 灰 度 级 


三 种 变换 举例 


。 说 明 : 
~ 512X512 大 小 的 单 色 图 像 
~ 先 将 原 图 分 割 为 &X8 大 小 的 子 图 像 ， 然 后 用 DFT, WHT 
和 DCT 的 一 种 ， 表 示 每 一 个 于 图 像 
~ 将 得 到 所 有 系数 的 50% 去 掉 ， 即 丢掉 32 个 系数 
~ 对 截取 的 系数 阵列 进行 逆 变 换 ， 保 留 32 个 系数 
~ 丢 抒 的 32 个 系数 ， 对 复原 图 像 质量 的 视觉 影 啊 很 小 
v 产生 的 均 方 误差 


fmSnFT2TISWwHT2TYIDSDeT 














三 种 变换 举例 


rmsnei= .28 


DFT 还 原 图 像 


rmswr=0. 86 


WHT 还 原 几 像 





rmsner=U. 68 


DCT 还 原 图 像 








三 种 变换 举例 

本 结论 一 一 

w DCT 的 信息 压缩 能 力 比 DFT 和 WHT 的 能 力 要 强 

~ WHT 是 最 容易 实现 的 

~ DCT 在 信息 压缩 能 力 和 计算 复杂 性 之 间 提 供 了 很 好 的 
平衡 ， 因 此 ， 许 多 变换 编码 系统 都 是 以 DCT 变 换 为 基 
础 的 

~ 对 比 其 它 方 法 ，DCT 变 换 共 有 使 用 单一 的 集成 电路 不可 
以 实现 ， 可 以 将 最 多 的 信息 包装 在 最 少 的 系数 之 中 

~ 可 使 “分 块 噪声 ”的 块 效应 最 小 ， 这 些 分 块 噪声 是 由 子 
图 像 之 间 的 可 见 边界 造成 的 











三 种 变换 举例 

v DFT 的 n 点 周期 性 造成 边界 中 断 ， 当 DFT 系数 被 截 尾 或 量 
化 时 ， 边 界 值 以 分 块 噪声 的 形式 出 现 ， 即 相 邻 子 图 像 之 
间 的 边界 变 得 可 见 。 而 DCT 变 换 不 会 产生 固有 的 边界 中 断 


Discontinuity 


DFT VAN vv 


DLL 






Pb 
FICURE 3.32 The periodicity implicit in the 1-D (a) DFT and (b) DCT. 


变换 编码 

e。 于 疼 像 太吉 选择 

” 于 图 像 太 寸 是 影响 变换 编 但 误 基 和 计算 复杂 度 
的 一 个 重要 因 妹 

~ 一 般 满 足下 列 2 个 条 件 
> 相 邻 子 图 像 之 间 的 相关 《元 余 ) 减少 到 可 接 有 党 
> 子 图 像 的 长 和 宽 都 是 2 的 整数 次 展 。 这 主要 是 为 了 简 

化 对 子 几 像 变 换 的 计算 
“ 最 季 用 的 了 图 像 矿 寸 是 8&X8 和 16X16 








子 图 像 太 寸 选择 


。 一 个 试验 例子 : 

“ 把 图 像 分 割 为 nDXn 的 子 图 像 nm=2, 4 8, 16 和 32) 

~ 计算 每 幅 子 图 像 的 变换 ， 鹤 取 75%% 的 系数 ， 对 规 取 后 的 
阵列 进行 反 变 换 得 到 

~ 当 图 像 尺 寸 大 于 8X8，WHT 和 DCT 曲 线 变 得 比较 平缓 ， 而 
DFT 曲线 下 降 得 较 快 。 对 更 大 的 n 值 ，DFT 将 罕 过 WHT 并 逼 
近 DCT 

~ 当 图 像 太 寸 为 2X2 时 ，3 条 曲线 交 于 同 1 点 。 此 时 各 变换 
都 只 保留 了 4 个 系数 中 的 1 个 〈25% ) ， 即 直流 分 量 





子 图 像 矿 寸 选 择 








FIGURE 8.33 3.5 
Reconstruction 
errOr VerSUS 
sublmasge SiZe. 





Root-mean-square error 


2X2 4Xx4 8Xx8 16Xx16 32X32 
Subimage Size 





变换 编码 


e。 比特 分 配 
~ 截断 误差 和 2 个 因素 有 关 
> 和 截 除 的 变换 系数 的 数量 和 相对 重要 性 
> 用 来 表示 所 保留 系数 的 精度 


~ 在 多 数 变换 编码 系统 中 ， 傈 留 的 系数 是 根据 下 列 2 个 准 
则 之 一 来 选择 确定 的 


> 最 大方 过 准则 ， 称 为 分 区 编码 
> 了 最 大 幅度 准则 ， 称 为 国人 编码 


~“ 整个 对 变换 子 几 像 的 系数 截断 、 量 化 和 编码 的 全 过 程 
称 为 比特 分 配 








比特 分 配 效 果 举 例 






症 编码 : 
保留 8 个 最 大 的 
变换 系数 ， 误 差 
比分 区 编码 小 
(64-8) /64=87. 5% 








变换 编码 
其 它 编 但 方法 
vv 子 这 (subband) 编 伍 
~ 小 疲 编 但 
vv 分形 〈fractal ) 编码 


~ 矢量 量化 (vector quantization,VQ) 编 
全 


”统计 编码 / 箭 编码 





图 像 压缩 标准 
e 相关 的 国际 组 织 


”TIS0 (International Standardization 
0rganization, 国际 标准 化 组 织 ) 
~ ITU (International Telecommunication Union， 
际 电信 联盟 ) ， 前 身 是 CCITT 〈 国 际 电 话 电 报 咨询 委员 
会 ) 

e 相关 工作 
~ 禾 着 了 从 二 值 到 灰 上 度 〈 彩 色 ) 值 的 静止 和 运动 图 像 


~ 采用 的 大 部 分 基本 扩 术 前 面 已 丝 介 绍 ， 主 要 包括 预 钢 
和 变换 编码 拉 术 














图 像 压缩 标准 


。 可 分 成 下 面 几 个 系列 
~ 用 于 压 综 二 值 匀 像 
~ 用 于 压缩 阁 止 匈 像 ， 包 括 灰 度 和 彩色 疼 候 
~ 用 于 压缩 运动 图 像 〈 视 频 ) ， 包 括 灰 度 和 彩 
色 图 像 
e 上 述 2 个 组 织 还 在 制定 一 些 新 的 标准 ， 其 
中 一 些 已 经 超出 纯 图 像 编码 的 范围 








二 值 图像 压 缩 标 准 


e 03 和 64 


~ 这 2 个 标准 是 由 CCITT 的 两 个 小 组 (Group 3 和 
Group 4) 负责 制定 的 


~ 最 初 是 CCITT 为 传真 应 用 而 设计 的 ， 现 也 用 于 
其 它 方面 

~ 63 采 用 了 非 自 适 应 、1 维 行程 编码 技术 。 对 每 
组 N 行 CN=2 或 N=4) 扫 摘 线 中 的 后 N-1 行 也 可 以 
用 2 维 方式 编码 


~ 64 是 63 的 1 种 简化 古本 ， 其 中 只 使 用 2 维 编 但 








二 值 图像 压 缩 标 准 


e G3 和 G4 ( 续 ) 


~ CCITT 在 制定 标准 期 间 曾 选择 了 1 组 共 8 幅 具有 
一 定 代 表 性 的 “试验 ”图 用 来 评判 各 种 压缩 方法 


~ 它们 既 包 括 打 印 的 文字 ， 也 包括 用 几 种 语言 
手写 的 文字 ， 态 外 还 有 少量 的 线 绘图 


~ 6G3 对 它们 的 压缩 率 约 为 15:1 
~ 64 的 压缩 率 一 役 比 6G3 融 1 倍 








二 值 图像 压 缩 标 准 





e@ JPEG(Joint Picture Expert Group) 


~ 由 ISO0 和 CCITT 联 合成 立 的 专家 组 负责 制定 青 
态 图 像 “〈 彩 色 与 灰 度 图 像 ) 的 压缩 算法 


V 


定义 了 3 种 编码 系统 


> 基于 DCT 的 有 损 编码 基本 系统 ， 可 用 于 绝 大 多 数 
压 腑 应 用 场合 


> 用 于 高 压缩 比 、 高 精确 度 或 渐进 重建 应 用 的 扩展 
编码 系统 


> 用 于 无 失真 应 用 场合 的 无 损 系统 





二 值 图像 压 缩 标 准 


e@ JPEG(Joint Picture Expert Group) 


~ JPEG 对 录像 机 质量 的 静止 图 像 的 压缩 率 一 般 
可 达到 25:1 








JPEG 基 本 系统 编 但 郁 框 图 


e 压 绾 过 程 
v DCT 计 算 
~ 量化 


~ 变 长 公 赋 值 





JPEG 基 本 系统 编 但 郁 框 图 


。 有 具体 压缩 过 程 
7 先 把 整个 图 像 分 解 成 多 个 8X8 的 图 像 块 


“8X8 的 图 像 块 经过 DCT 变 换 后 ， 低 频 分 量 都 集中 在 元 上 角 ， 忆 
频 分 量 则 分 布 在 右 下 角 〈DCT 变 换 类 似 于 低 通 滤波 器) ， 因 为 低 
频 分 量 包含 了 图 像 的 主要 信息 ， 所 以 可 以 忽略 高 频 分 量 ， 达 到 压 
编 的 目的 ; 


~ 使 用 量化 操作 去 邱 高 频 分 量 ， 量 化 操作 瑟 是 将 未 一 个 值 除 以 量 
化 表 中 的 对 应 值 。 由 于 量化 表 中 左上 角 的 值 较 小 ， 而 右 下 角 的 信 
较 大 ， 这 样 达 到 保持 低频 分 量 ， 抑 制 高 频 分 量 的 目的 ; 


v~ 在 左上 角 的 低频 分 量 中 , F(0, 0) 代表 了 直流 DC) 系数 ， 即 8X8 
子 块 的 平均 值 。 由 于 两 个 相 邻 图 像 块 的 DC 系数 相差 很 小 ， 所 以 采 
用 天 分 编码 DPCM, 其 它 63 个 元 际 是 交流 (AC) 系数 ， 采 用 之 宁 型 
(zig-zag) 顺序 进行 行程 编码 ， 使 系数 为 0 的 值 更 集中 

















JPEG 基 本 系统 编 但 郁 框 图 


e。 有 具体 压 盎 过 程 


”在 得 到 DC 码 字 和 AC 行 程 码 字 后 ， 为 了 进一步 提高 压缩 比 ， 再 
进行 箭 编码 ， 采 用 了 Huffman 编 码 














视频 压缩 标准 
e。 视频 压缩 标准 
~ 基本 概念 
~ 电视 会 议 标准 
> H.261、H. 263 
~ MPEG 标 准 


> MPEG-1、MPEG-2、MPEG-4、MPEG-7 
和 MPEG-21 








一 个 运动 图 像 例 子 
DEMO 


观察 一 段 视 频 解 压 纵 后 的 图 像 





MPEG 帧 的 分 类 





e 工 怖 (Intra-picture) 
不 需要 参考 其 它 画 面 而 独立 进行 压缩 编码 的 画面 


e P 帆 (Predicted-picture ) 
参考 前 面 已 编码 的 I 或 P 画 面 进行 预测 编码 的 画面 


e B 帧 (Bidirectional-picture) 


既 参 考 前 面 的 I 或 P 男 面 、 叉 参考 后 面 的 I 或 P 国 面 
进行 双 回 预测 编码 的 画面 








视频 压缩 标准 


e。 连续 师 图 像 压缩 的 基本 四 外 
“可 以 根据 同 帧 附近 像 了 系 来 加 以 预 训 ， 科 
称 为 : 帧 内 编码 扩 林 


“可 以 根据 附近 帧 中 的 像 姑 来 加 以 预测 ， 
似 称 为 : 怖 间 纺 但 扩 术 





视频 压缩 标准 


e I 眉 上 轩 了 预 训 编 三 
~ 回 前 预 负 
La 
~ 双 同 预测 
La La 








MPEG 帧 的 分 类 
MPEG 的 画面 组 (GOP) 


PVP PT 






葡 忆 和 修 4 本 二 天 





MPEG 帧 的 分 类 














由 于 画面 内 容 有 连贯 









4 素 妇 尼 克 ) 电影 上 的 和 关 性 ,因此 当前 画面 的 认 
有 容 可 以 看 作 是 前 面 男 





面 内 容 的 位 移 ( 运 动 )。 







人 
| 四 
下 兴 





画面 各 处 相应 的 位 移 
量 ( 幅 度 、 方 癌 ) 各 有 
不 同 ， 因 此 画面 应 细 
分 成 其 ( 宏 块 )， 以 安 
块 为 单位 ， 找 出 两 
画面 中 相应 宏 块 之 间 
的 位 移 量 --- 运 动 天 量 






























GOP(Group of Pictures ) 


哟 或 


[ 
2 
B 
] 
此 , 每 一 个 aUP 中 的 画面 在 编码 前 和 解码 后 都 必须 重 排序 


和 
共 
嘱 
几 
征 
蚂 
画 


画面 的 显示 顺序 
画面 的 编码 顺序 





MPEG 帧 的 分 类 


DEMO 


观察 MPEG 的 运动 矢量 








IS0 国 际 标准 的 制定 过 程 


。 工作 组 草案 (WD) -> 委员会 草案 (CD) -> 国际 标 

准 理 案 (DIS)=> 国 际 标准 (IS) 

v 工作 组 章 守 WD (Working Draft): 工作 组 WG(Working 
Group) 准备 的 工作 文件 

v 委员 会 草案 CD (Committee Draft) : 从 名 提升 上 来 的 文 
件 。 这 是 IS0 文 档 的 最 初 形 式 ， 它 由 IS0 内 部 正式 调查 研 
完 和 投票 表 诀 。 

v 国际 标准 章 案 DIS (Draft International Standard) : 
国 对 CD 的 内 容 和 说 明 满 意 之 后 由 CD 提升 上 来 的 文 


v 国际 标准 IS(International Standard) : 由 成 员 国 、 
门 和 其 他 委员 会 投票 通过 之 后 出 版 发 布 的 
文件 。 








电视 会 议 标 准 


.261 标 准 

应 用 范围 : 电视 会 议 
主要 编码 技术 : 

> _ DCT 变换 

> 回 前 运动 补偿 预测 
> Zig-zag 排 序 

> 霍 夫 曼 编 码 
TREE LEE 


AR 








电视 会 议 标准 


e。 H. 263 标 准 

~ 应 用 范围 : 可 视 电 话 
~ 主要 编 伺 扩 术 : 

> DCT 换 

> 双 同 运动 补偿 预测 

> Zig-zag 排 序 

> 霍 夫 曼 编 权 
TBBPBBPBBIBBP .， .， . 





多 媒体 压缩 标准 


e MPEG 系 列 标准 (Moving Picture Expert 
Group) 


w ISOV/IECVJTC1ZSC29 的 一 个 工作 组 WG11，1988 年 
成 立 ， 目 前 有 25 个 国家 (团体 ) 的 200 多 个 公司 300 
多 名 成 员 分 10 个 组 工作 


~ JPEG 的 目标 是 专门 集中 于 静止 图 像 压 缩 ，MPEG 
的 目标 是 针对 运动 图 像 的 数据 压缩 ， 但 是 JPEG 和 
MPEG 有 密切 联系 

~ MPEG 专 家 小 组 ， 不 仅 限 制 于 数字 视频 压缩 ， 音 
频 及 音频 和 视频 的 同步 问题 都 不 能 脱离 视频 压缩 
独立 进行 





MPEG-I 标 准 





e MPEG-1 标 准 (ISO/IEC11172). 1992 年 发 布 。 
用 于 1. 5Mbps 数 据 传输 率 的 运动 图 像 及 其 伴音 的 
编码 。 主 要 应 用 于 VCD，MP3 音 乐 等 

e MPEG-1 在 JPEG 和 H. 261 等 优秀 标准 的 基础 上 ， 对 
参加 竞争 的 14 个 方案 , 通过 反复 协调 而 得 到 统一 ， 
从 而 成 为 先进 、 人 合理、 质量 高 、 成 本 低 的 优秀 
标准 

e MPEG-1 促 进 了 大 规模 集成 电路 专用 心 帮 的 发 展 ， 
为 多 媒体 技术 和 产品 的 繁 匠 立 下 了 功 萎 








MPEG-1 标 准 〈 续 ) 


e MPEG-1 标 准 
> _ DCT 变换 
前 癌 、 双 同和 运动 补偿 预测 
Zig-zag 排 序 
霍 夫 受 编码 、 算 术 编 码 
> 每 15 帧 至 少 要 有 一 个 I 顺 
TBBPBBPBBIBBP . 


立 六 





MPEG-2 标 准 





e MPEG-2 标 准 (ISOZIEC13818)，1994 年 发 
布 

e 主要 针对 高 清晰 度 电视 (HDTV) 的 视频 及 
伴音 信号 ， 和 典型 传输 速率 为 10Mbps， 与 
MPEG-1 碌 容 ， 适 用 于 1. 5Mpps 一 60Mpps 甚 
全 更 高 速率 的 编 但 苑 转 








MPEG-2 标 准 〈 续 ) 


e 以 MPEG-2 作 为 视 音 频 压 缩 标 准 的 数字 卫星 电视 
接收 机 已 在 欧美 形成 了 很 大 市 场 ， 美 国 高 级 电 
视 联 盟 (ATV Grand ALliance) 和 欧洲 数字 视频 
广播 计划 (Digital Video Broadcast Pro ject) 
先后 决定 将 MPEG -2 用 于 高 清晰 度 电视 (HDTV) 广 
播 中 

e 新 一 代 的 数字 视盘 DVD 采用 MPEG-2 作 为 其 视 音频 
压缩 标准 ( 注 : 欧 、 美 、 日 在 视频 方面 采用 
MPEG-2 标 准 , 而 在 音频 方面 则 采用 AC-3 标 准 ) 





MPEG-4 标 准 

e MPEG-4 标准 (ISO/ZIEC 14496) . 
v 1999 年 5 月 形成 国际 标准 (版 本 1) ， 是 一 种 基于 对 象 的 
视 ( 音 ) 频 编码 标准 , 目标 是 支持 各 种 多 媒体 应 用 (主要 
侧重 于 对 多 媒体 信息 内 容 的 访问 ) 

v 为 了 适应 在 窗 带 宽 (一 般 指 <64kbit/s) 通信 线路 上 对 动 
态 图 像 进行 传输 的 要 求 

v 总 目标 是 对 各 种 音频 视频 ， 主 要 包括 : 静止 图 像 、 序 
列 图 像 、 计 算 机 图 形 、3D 模 型 、 动 画 、 语 言 、 声 音 等 
进行 统一 有 效 的 编码 





MPEG-4 标 准 〈 续 ) 


e MPEG-4 标准 (ISO/ZIEC 14496) . 
v 既 文 持 固 定 码 流 也 文 持 变 码 流 ， 对 3 种 码 流 范围 的 视频 
己 达 节 优 : 


> 《 64k bity/s 





> 64 - 384k bit/s 


> 364 kbit/s - 4M bity/s 


> 目前 还 在 考虑 直到 50M bit/s 的 码 流 





MPEG-7 标 准 





e MPEG-7 标 准 


“多 媒 体内 容 摘 述 接口 ”(Multimedia Content 
Descfription Intefrface) 的 标准 

w 该 标准 将 确定 各 种 美 型 的 多 媒体 信息 的 标准 摘 述 方 
法 ， 可 应 用 于 数字 图 书馆 、 各 种 多 媒体 目录 服务 、 
广播 妹 体 的 选择 ， 以 及 多 代 体 编辑 等 领域 

目标 是 指定 1 组 摘 述 不 同 多 媒体 信息 的 标准 描述 
侍 ， 这 些 朱 述 要 与 信息 内 容 相关 以 便 能 快速 和 有 效 
地 奏 询 各 种 多 人 体 信息 








MPEG-7 标 准 〈 续 ) 


e MPEG-7 标 准 
w MPEG-7 采 取 的 描述 方案 和 方法 与 被 描述 内 容 是 否 编 
人 码 或 如 何 存 储 无 和 关 ， 例 如 视觉 信 号 仍 可 以 用 已 有 的 
各 种 编码 方案 (如 JPEG，MPEG-1, MPEG-2, MPEG-4 
等 ) 进行 编码 
v 计划 2001 年 9 月 形成 ， 但 还 有 许多 研究 工作 要 做 





MPEG-21 标 准 





e MPEG-21 标 准 ， (Multimedia Framework) 
多 群 体 框 如 标 准 适 合 于 多 种 应 用 领域 中 
各 种 类 型 用 户 对 各 种 次 型 内 容 的 传达 和 
使 用 ， 可 通过 大 苑 围 的 网 络 和 设备 允许 
对 多 寻 体 资源 的 透明 和 增强 使 用 








数字 图 像 处 理 〈9) 


任何 问题 ? 
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。 概述 

e 集合 论 基 础 知识 

。 膨胀 和 腐蚀 : 产生 滤波 器 作用 

e 开 操作 和 闭 操作 : 产生 波 波 堪 作 用 
e 击 中 或 击 不 中 变换 

e 形态 学 的 主要 应 用 : 


边界 提取 、 区 域 填 充 、 连 通 分 量 的 提取 、 凸 元 、 
化 、 粗 化 等 





细 








~ 形态 学 一 般 指 生物 学 中 研究 动物 和 桓 物 结构 
的 一 个 分 文 


~ 用 数学 形态 学 〈 也 称 图 像 代 数 ) 表示 以 形态 
为 基础 对 疼 像 进行 分 析 的 数学 工具 


~ 基本 思想 是 用 具有 一 定形 态 的 结构 元 系 去 度 
量 和 提取 图 像 中 的 对 应 形状 以 达到 对 图 像 分 析 
和 识别 的 目的 

形态 学 图 像 处 理 的 数学 基础 和 所 用 语言 是 集 


合 论 








e。 人 慨 述 〈 续 ) 


“ 形态 学 图 像 处 理 的 应 用 可 以 简化 图 像 数 据 ， 
保持 它们 基本 的 形状 特性 ， 并 除去 不 相干 的 结 
构 


~ 形态 学 图 像 处 理 的 基本 运算 有 4 个 : 膨胀 、 
欣 蚀 、 开 操作 和 闭 操 作 


集合 论 基 础 知识 


习 集 合 的 并 、 艾 、 








4UB 


(4 


仆 、 关 


人 44 门 召 


a bc 
de 


FIGURE 9.1 

(aj) Two sets 4 
and 玉 .(b) The 
unlion of 4 and 互 . 
(c) The 
intersection of 4 
and 玉 .(d) The 
complement of 4. 
(e) The difference 
between 4 and 妃 . 








形态 学 图 像 处 理 
e。 集合 论 基 础 知识 
” 集合 B 的 反射 8 ， 定 义 为 B= tw|w=- 孔 be 由 
即 关 于 原 集合 原点 对 称 
集合 A 平 移 到 点 z=(zj, z), 表示 为 (A) ， 
(4). =tclc=a+zae4| 





为 


反射 


十 _ 
FIGURE 9.2 
{aj Translation of 
4 by zx. 
ee flection of 
只 光 4and 
玉 are 
Fis. 地 








形态 学 图 像 处 理 


。 脱 上 胀 和 腐蚀 
“ 膀 胀 : 使 图 像 扩 大 
A 和 B 古 两 个 集合 ，A 被 B 膨 上 胀 定 义 为 : 


es-| 引 | 


> 上 陈 表 示 : B 的 反射 进行 平移 与 A 的 交集 不 为 衬 
> B 的 反射 : 相对 于 目 且 原点 的 映 象 
> B 的 平移 : 对 B 的 反射 进行 位 移 








形态 学 图 像 处 理 


。 脱 上 胀 和 腐蚀 
“ 月 胀 的 太一 个 定义 


es-|( 引 nc 


> 上 陈 表 示 : B 的 反射 进行 平移 与 A 的 交集 是 A 的 
子 集 





膨胀 举例 











集合 B 关 于 原点 对 称 
时 一 
娃 
[jw 
局 一 了 
星 本币 醒 
村 导 EN 
保证 B 的 反射 的 平移 与 A 的 交集 不 为 空 
三 上 
王 
吾 一 尾 





脱 胀 应 用 举例 
v 桥接 文字 和 八 缝 








优点 : 在 一 幅 二 值 狗 像 中 百 搂 得 到 络 东 ， 对 比 
低 通 滤 小 方法 


纪 1 C 
HistoriCaly，certaimn comptter Historicaly，certain computer b 
proegrans were Written Using progrars were Written USin9 FIGURE 9.5 
Oniy tw 本身 比 S fatier 寸 拉 aam oniy two 由 gilts frathefr than 1 es 
four to define the applicable foufr zxo define the applicabie with broken 
Yaar、Aceordi3giy，the year、Accordingiy， the 人 有 
company's 5oftware mmay companyis 50 比 Ware mmay (b) Structuring 
regognize 3 datea Using "00" recognize # dbte Using "00" element， 
as 1900 rather than the y 攻 相 r as 1900 rather than the yE 引 相生 

segments Were 

joined. 





膀 胀 的 结构 元 系 B 








形态 学 图 像 处 理 


e 彩 胀 和 腐蚀 
“ 腐蚀 : 使 图 像 缩 小 
A 和 B 是 两 个 集合 ，A 被 B 腐 蚀 定 义 为 : 
49B=f{z|(B) ES4| 





欣 蚀 举例 








A 和 被 B 腐 蚀 的 结 采 


4 日 刀 





dM4 


dd/2 


df 所 
1 
| 


和 四 隐 
到 臣 


FIGURE 9.6 (aj Set A.(b) square structuring element.(c) Erosion of 4 by B, shown 
shaded.(d) Elongated structuring element. (e) Erosion of 4 using this element. 





欣 蚀 应 用 举例 
vY 使 用 腐蚀 消除 冬 像 的 细节 部 分 ， 产 生 滤 小 规 
的 作用 


包含 边 长 为 1,3,5,7.9 使 用 13X13 像 素 大 小 ”使 用 13X 13 像 素 大 小 的 疆 
和 15 像 素 正 方形 的 二 “的 结构 元 素 认 蚀 原 图 “ 构 元 北 膨胀 鲜 b， 恢 复原 来 
值 图 像 像 的 结果 1$X15 尺 寸 的 正方 形 














恒 攻 ” 由 “， 
a hb 多 a 儿 b 儿 c 
RE of S Squares el1.3.3.7.9.and 13 Pixels on the .(b) Erosion ' Square 
structuring element ' of .13 PIXe 全 和 Side.(C Dilatio On of (Pb) with < same structuring eleme 








形态 学 图 像 处 理 


e。 开 操作 和 闭 操作 


“ 开 操作 : 使 图 像 的 轮廓 变 得 光滑 ， 岂 开 狭 罕 
的 间断 和 消除 细 的 突出 物 


> 使 用 结构 元 素 B 对 集合 A 进 行 开 操作 ， 定 
义 为 : 
4oB=(49B)@B 


> 舍 义 : 先 用 B 对 A 腐 蚀 ， 然 后 用 B 对 结 采 膀 
乃 


> 另 一 个 定义 4*B=wiB)-1(B). S 4 








形态 学 图 像 处 理 


e。 开 操 作 和 闭 操作 


“ 财 操 作 : 同样 使 图 像 的 轮廓 变 得 论 请 ， 但 与 
开 操 作 相 反 ， 它 能 消除 狭 罕 的 间断 和 长 细 的 商 
沟 ， 消 除 小 的 孔洞 ， 并 项 补 轮廓 线 中 的 八 妆 


> 使 用 结构 元 系 B 对 集合 A 进 行 财 操 作 ， 定 
拉 4e。B=(4 四 B)DB 


> 合 义 : 先 用 B 对 A 膀 胀 ， 然 后 用 B 对 疆 末 腐 
伺 








开 操作 的 几何 解释 


~“ 4o8B 的 边界 通过 B 中 的 点 完成 
~ B 在 A 的 按 神 内 转动 时 ，B 中 的 氮 所 能 到 达 的 A 的 边界 的 
的 最 远 操 





4:8B=Uf(B)z|(B)zc 4] 





构思 


FIGURE 9.8 (aj Structuring element Brolling” along the inner boundary of 4 (the doft 
indicates the origin of 召 ). (c) The heavy line 1s the outer boundary of the opening. 
(d) Complete opening (Shaded). 





财 操作 的 几何 解释 


~ 4e 甩 的 边界 通过 B 中 的 操 完成 
~ B 在 A 的 边界 外 部 转动 








4 … 卫 





到 史上 


FIGURE 9.9 (a) Structuring element Brollins ”on the outer boundary of set 4.(b) Heavy 
line is the outer boundary of the closing.(c) Complete closing (Shaded ). 





形态 学 图 像 处 理 
e。 开 操作 的 3 条 性 质 


“ 4o8 坪 A 的 子 集合 





~ 如 条 C 古 D 的 子 集 ， 则 Co 如是 DeB 的 子 集 
V/ (4oB)oB=4oB 

e 财 操 作 的 3 条 性 质 

“ A 是 4。8B 的 子 集合 

~ 如 条 C 征 D 的 子 集 ， 则 Ce5 是 De8 的 子 集 
V (4e。Bje。B=4eB 








开 操 作 和 闭 操 作 应 用 举例 
e 说 明 : 虽 作 再 闭 操 号 声 滤波 对 
v 人 噪声 污染 的 指纹 二 估 图 像 声 为 

本 主人 直 0 和 开 攻 宙 闫 二 汪 二 丰 这 全 元 对 
~ b 疼 是 使 用 的 结构 元 际 


“图 征 使 用 吉 构 元 素 对 图 a 腐 蚀 的 结果 :， 黑色 
背景 噪声 消除 了 ， We 


~ d 图 是 使 用 结构 元 了 系 对 图 c 膀 胀 的 结束 : 

于 指纹 中 的 噪声 分 量 的 矿 寸 被 诚 小 或 被 所 全 消 
除 ， 带 来 的 问题 是 ， 在 指纹 纹路 间 产 生 了 新 的 
间断 








开 操 作 和 闭 操 作 应 用 举例 


e。 说 明 〈 续 ) 


“ ee 图 是 对 图 d 脱 胀 的 结束 ， 图 d 的 大 部 分 间 电 
航 恢 复 ， 但 指纹 的 线路 变 粗 了 

~ 人 图 是 对 图 e 亢 蚀 的 结束 ， 即 对 图 d 中 开 操 作 
的 财 操 作 。 最 后 结束 消除 了 噪声 斑 操 


~ 缺点 : 指纹 线路 还 是 有 缺 点 ， 可 以 通过 加 入 
限制 性 条 件 解雇 








开 操 作 和 闭 操 作 应 用 举例 


[(4:B) 四 B]eB=(4.B).B 





国 阳 
FIGURE 9.11 
(a) Noisy imase. 
(Cc) Eroded image. 
(d) Opening of 4 . 
(d) Dilation of the 
opening. 
(e) Closinas of the 
opening.(Original 
image for this 
exXample coUrtesy 
of the National 
Institute of 
standards and 
Technolosy.) 













设 X 被 包围 在 一 个 小 窗口 W 中 ， 与 
W 有 天 的 X 的 局 部 背景 定义 为 W-X 








X 对 A 腐 蚀 的 纺 











W-X 对 A 的 补 集 
腐蚀 的 结果 





书 们 的 交集 ， 得 到 X 
的 原点 位 置 。 在 该 位 
置 ，X 找 到 了 在 A 中 的 
匹配 《〈 击 中 ) 










击 中 或 击 不 中 变换 
个 州 天 公 羡 

A 中 对 B 进 行 的 匹配 〈 击 中 ) 表示 为 : 

AeB= (49X)nr[4“9o(W -XD) 

A BEB= (46@B)Jnlkeepj B=(Bi,B)) Bi = 从 ,2 =( 呈 一 X) 

B; 是 由 与 一 个 对 象 相 联系 的 B 元 系 构 成 的 集合 ， 

B,) 征 与 相应 背景 有 关 的 B 元 素 的 集合 


ABB= (49B8i)-[4@95，] 





形态 学 的 主要 应 用 


e。 边 弄 近 取 


~ 边 弄 提取 定义 为 
4J=4-(4QB) 





~ 上 陈 表 示 : 先 用 B 对 A 雇 蚀 ， 然 后 用 A 减 去 诊 蚀 得 
到 ，B 坪 结构 元 系 


ab 
要 汉 


FIGURE 9.13 (ay) Set 
4.(b) structuring 
element 吾 .(c) 4 
eroded by 如 . 

(d) Boundaryv. piven 
by the set 
difference between 
4andits eroslon. 


Origin 





边界 提取 举例 
“ 1 表示 为 白色 ，0 表 示 为 黑色 








原 /AN 


结构 元 际 B 


a hb 


FIGURE 9.14 

(a) ASsimple 
binary Image, with 
1 s represented in 
white.(P) Result 
of using 
Eq.(9.3-1) with 
the Structuring 
element in 

Fic. 9.13(b). 





形态 学 的 主要 应 用 
e 区 域 填 厚 
~ 区 域 填 充 定 义 为 
X,， =(X 四 四 ) 门 4 大 =12.3，… 


Xo=p， 如 采 X=X-1， 则 算法 在 友 代 的 第 k 步 结束 。 久 
和 A 的 并 集 包 侣 被 填充 的 集合 和 它 的 边界 
~ 条 件 脱 胀 : 如 条 对 上 述 公 去 的 天 部 不 加 限制 ， 则 
上 述 公 式 的 脱 胀 将 填 完 整个 区 域 。 利 用 As 的 交集 将 
结束 限制 在 感 兴趣 区 域内 ， 实 现 条 件 膀 胀 
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区 域 填 充 说 明 





区 域 填 充 举 例 








“通过 区 域 填 充 消 除 日 色 圆 罗 内 的 黑 操 


第 一 个 点 填充 的 结果 





到 加 让 

FIGURE 9.16 (a) Binary imase (the white dot inside one of the repions is the Starting 
point for the reslion-flling algorithmj.(b) Result of flling that reglion (C) Result of 和 由 - 
ing all reslons. 





形态 学 的 主要 应 用 
。 连通 分 量 的 提取 
“ 令 Y 表 示 一 个 包含 于 集合 A 中 的 连通 分 量 ， 并 假设 Y 


中 的 一 个 点 p 是 已 知 的 。 用 下 列 欠 代 式 生 成 Y 的 所 有 
元 际 : 





X =(X 四 BA4 大 =123.… 


X0 一 D， 如 采 X =X 一 1 》 算法 收敛 ， 令 Y=X 





连通 分 量 提取 说 明 


8 连通 的 结 爸 元 素 ”第 一 次 迭代 的 结 


Oriocin 








人 ET 
0 -Hpsssn 
第 二 次 欠 代 的 绪 果 十 上 -hs 


。 国 -ESNNS 
国 面 面 硬 硬汉 HKKNNSAN 

ISSN _ THKSSSN_ | 

TKSSN_ TSSSN 
[NINTITD - 因 |NTTD 
ab [ESNTTTD TSSNTTTD 





国有 中 本 国 故国 辆 国 二 | 国 轩 画 辆 图 贺 丽 图 贺 图 图 辆 


FIGURE 9.17 (aj set 4 showins initial point P (all shaded points are valued 1. but are 
shown different from P to indicate that they have not yet been found by the algorithm). 
(bj) structuring element. (c) Result of first iterative step. (d) Result of second step. 
(e) Final result. 





连通 分 量 近 取 的 应 用 举例 





含有 碎 骨 的 鸡 胸 X 光 图 像 


E 


FIGURE 9.18 

(a) XX-ray Image 
of chlicken filet 
WwWith bone 
fragments. 

(Pb) Thresholded 
Imase.(Cc) [Image 
eroded with a 

3 X SSstructuring 
element of 1 7S. 
(d) Number of 
PIXels In the 
connected 





使 用 阔 值 将 骨头 从 背景 中 
一 提取 出 来 


Connected “No. of Pixels in 
component “connected comp 








01 11 
components ol 02 9 
(c). (Imasge 03 9 
courtesy of NTB 04 39 
Elektronische 05 
Geraete GmbHL 06 
Diepholz， 07 
Germany, 08 < 一 > 
wwwntbxravcom.) 09 了 
10 11 
11 11 
12 9 
13 9 
三 二 
15 5 


消除 细节 ， 对 浆 值 处 理 后 的 图 像 进行 腐蚀 ， 提取 连通 分 量 ， 识 列 大 矿 十 
保留 大 矿 才 物体 对 象 ， 其 中 4 个 具有 最 大 矿 寸 








形态 学 的 主要 应 用 
e 症 壳 


“ 如 采 连 接 集 合 A 内 任意 两 个 点 的 直线 段 都 在 A 的 内 
部 ， 则 A 是 凸 形 的 


” 集合 S 的 凸 元 8 是 包 侣 S 的 最 小 串 集 合 
~ HS 称 为 $ 的 凸 缺 
“ 求 取 集合 A 的 凸 元 CA) 的 简单 形态 学 算法 : 
令 B 表示 4 个 结构 元 素 , ji=l 2, 3, 4 
Xi = 人 (Z 18BU4 1=1234 大 =12.3.4. 


X0 二 4 令 D' s 》 conv 表 示 在 X'/ XtI 收 敛 ， 则 














式 





态 学 的 主要 应 用 
册 


玉 cU)-=UD: 

， 先 对 A 用 B: 运 用 击 中 或 击 不 中 变换 ， 反 复 使 用 ， 当 下 
再 发 生变 化 时 ， 执 行 与 A 的 并 集运 算 ， 用 DI 表 示 结 果 
上述 过 程 用 B? 重 复 ， 直 到 不 发 生变 化 。 

最 后 得 到 的 4 个 D 的 并 集 组 成 了 A 的 凸 过 


计算 凸 这 举例 


b 
e 








dd 
8 


已 喇 习 咏 


FIGURE 9.19 国 辆 图 图 力 


(a) Structuring 
elements. (bj Set 
4.f(c)-( 昌 Results 
of convergence 
WwWith the 
Structuring 
elements Shown 
in (a).(5) Convex 
hull.(h) Convex 
hull showing the 
contribution of 
each structuring 
element. 


图 力图 国 川 阅 瑟 图 图 回力 

| | | 国 国 国 | | | | | 

EN 
图 c-{ 是 用 图 a 中 的 结构 元 素 SS 2 图 显示 4 个 结构 元 素 的 
得 到 的 收敛 结 属性 








计算 凸 这 举例 〈 续 ) 








“上述 过 程 的 一 个 明显 缺点 是 : 凸 壳 可 能 超出 确保 凹 性 所 
需 的 最 小 尺 二 

7 解决 办 法 : 限制 水 平和 垂直 方向 上 的 尺寸 大 小 ， 如 下 
图 所 示 。 

“也 可 限制 水 平 、 垂 直 和 对 角 线 方向 上 的 最 大 尺寸 。 缺 点 
是 增加 了 算法 的 复杂 性 


画面 丽 电 出 圆 可 男 面 
世博 
乡 禾 罗 罗 民国 国 





男 圈 图 图 国 ”图 国 贺 轿 贺 

国 图 图 图 图 国 周 图 而 图 图 
FIGURE 9.20 Result of limiting growth of convex hull algorithm to the maximunm di- 
mensions of the original set of points alons the vertical and horizontal directions. 


形态 学 的 主要 应 用 
e。 细 化 
~ 细 化 过 程 根据 击 中 或 击 不 中 变换 定义 
4@B=4-(4BB)=A4m4eB1 
~ 定义 结构 元 陛 序 列 为 
{B}= 证 1,B2,B3，.,B2| 
Bi 是 B 熏 旋转 后 的 形式 ， 如 在 B 中 旋转 900 
~ 用 结构 元 素 序 列 定义 细 化 为 
4@ 人 =( 人 人 4@Bjep2j) Ja@Bn 
即 连 续 使 用 B1，B2，...，Bn 对 A 细 化 








细 化 过 程 举例 








4g 盏 4356.7.8,1.23 


FIGURE 9.21 (a) Sequence of rotated structuring elements used forthinning. (b) Set 4. 
(c) Result of thinning with the first element. (d)-() Results of thinning with the next 
Seven elements (there was no change between the seventh and eighth elements). 0 ) Re- 
sult of usins the first element again (there were no changpes for the next two elements). 
(k) Result after conversence. (上 Conversion to 1-connectivitV. 


形态 学 的 主要 应 用 
e。 钥 化 
” 粗 化 和 细 化 在 形态 学 上 是 对 偶 过 程 ， 定 义 为 
4G@B=A4U(4BB) 
~ 用 结构 元 系 序 列 定 义 粗 化 为 
4o{B}=( 人 4AeBjsB2).Jes" 
即 连续 使 用 B1!，B2，...，Bn 对 A 粗 化 
~ 粗 化 可 以 通过 细 化 算法 求 补 集 实现 : 


移 对 所 讨论 集合 的 青 景 进行 细 化 ， 然 后 对 结 末 求 
补 集 ， 即 





形态 学 的 主要 应 用 
。 粗 化 
” 粗 化 可 以 通过 细 化 算法 求 补 集 实现 ; 


为 了 对 集合 A 进 行 粗 化 ， 先 令 C=Ac， 然 后 对 C 进 行 
细 化 ， 最 后 形成 Ce 









Ac* 细 化 的 结 
形成 一 条 边界 


对 As* 细 化 结果 求 补 


FIGURE 9.22 (a) set 4.(b) Complement of 4.(c) Result of thinning the complement of 
4.(d) TIhickened set obtained by complementing (c).(e) Final result、 with no discon- 
nected points. 








数字 图 像 处 理 〈10) 


任何 问题 ? 
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图 像 分 割 


e。 慨 述 

e 辣 断 检测 

e。 过 绿 连接 和 边界 检测 
e。 贱 值 处 理 

e 基于 区 域 的 分 割 

e 分 割 中 运动 的 应 用 





图 像 分 割 


分 割 的 目的 : 将 图 像 划 分 为 不 同 区 域 

e 三 大 类 方法 
~ 根据 区 域 间 灰 度 不 连续 搜寻 区 域 乙 间 的 边 
界 ， 在 间断 检测 、 边 缘 连 接 和 边界 检测 介绍 


~ 以 像 系 性 质 的 分 布 进行 国 值 处 理 ， 在 国人 处 
理 介 绍 


~ 十 搂 搜 寻 区 域 进行 分 割 ， 在 基于 区 域 的 分 割 
中 介绍 








图 像 分 割 


。 概述 


~ 在 对 图 像 的 研究 和 应 用 中 ， 人 们 往往 仅 对 图 
像 中 的 东 些 部 分 感 兴趣 ， 这 些 部 分 一 般 称 为 有 目 
标 或 前 景 

~ 为 了 辨识 和 分 析 目 标 ， 需 要 将 有 天 区 域 分 离 
提取 出 来 ， 在 此 基础 上 对 目标 进一步 利用 ， 如 
进行 特征 皖 取 和 测 量 

~ 岁 像 分 割 束 是 指 把 图 休 分 成 各 具 特 性 的 区 城 
并 提取 出 感 兴趣 目标 的 拉 术 和 过 程 





图 像 分 割 


。 概述 〈 续 ) 
~ 特性 可 以 是 灰 度 、 颜 色 、 纹 理 等 ， 目 标 可 以 
对 应 单个 区 域 ， 也 可 以 对 应 多 个 区 域 
~ 图 像 分 割 算法 是 基于 腕 度 值 的 不 连续 性 和 相 
似 性 
> 不 连续 性 是 基于 胸 度 的 不 连续 变化 分 割 图 像 ， 如 
图 像 的 边缘 
> 根据 制定 的 准则 将 图 像 分 割 为 相似 的 区 域 ， 如 国 
值 处 理 、 区 域 生 长 、 区 域 分 离 和 聚合 





图 像 分 割 举 例 
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基于 边缘 生长 的 图 像 分 割 算法 绪 宁 


e。 人 参考 文献 : 林 通 , “基于 内 容 的 视频 索引 与 检索 方法 的 研究 ” 
北京 大 学 数学 科学 学 院 ， 博 士 论文 ，2001.。 














意 / 


《 刘 ( 力 o 








于 边缘 生长 的 图 像 分 割 算 法 疆 











基于 边缘 生长 的 图 像 分 割 算法 结 宁 








图 4.9:_ woof 图 象 的 分 割 结 果 









基于 边缘 生长 的 图 像 分 割 算法 络 宁 


图 4.11: oremwzaz 视 笑 帧 图 象 的 分 割 结果 ， 





图 像 分 割 


。 概述 

e 辣 断 检测 

e。 过 绿 连接 和 边界 检测 
e。 贱 值 处 理 

e 基于 区 域 的 分 割 

e 分 割 中 运动 的 应 用 





图 像 分 割 


e。 间断 检测 
~ 点 检测 
~ 线 检 测 
~ 边缘 检测 
e 寻找 间断 的 一 般 方 法 :模板 检测 


9 
1 一 | 














间断 检测 


e。 扣 检 训 


使 用 如 图 所 示 的 模板 ， 如 末 | 太 >z7 ， 则 在 模 
板 中 心 位 置 检 调 到 一 个 点 


其 中 ，T 是 浆 值 ，R 是 模板 计算 值 





7 基本 思想 ， 如 果 一 个 孤立 点 与 它 周围 的 点 不 
邮 ， 则 可 以 使 用 上 述 模板 进行 检测 

7 注意 :如 果 模 板 响应 为 0， 则 表示 在 灰 度 级 
为 常数 的 区 域 








反 检 测 例子 


孔 中 徘 有 一 个 黑 氮 应 用 检测 模板 的 结果 “使 用 图 b 中 像素 最 高 值 的 90% 
作为 较 值 


了 二] 2 
本 
人 > 
本 
] - ， 疝 站) 
员 LE - 
了 下 1 
1 
上 四 
SS 
| 
下 
间 寺 
| 
入 / 
7 2 
明 
站 
R 
了 
3 
引 : 匠 | 
:于 
过 ER 
和 全 


扳 立 点 可 以 通过 检测 模板 并 设置 国 值 进行 
检测 








间 上 断 检 测 


。 线 丛 训 
~ 4 个 线 检测 模板 


FIGURE 10.3 Line 
masks. 











Horizontal 二 4 


第 一 个 模板 对 水 平 线 有 最 大 响应 


Vertical 一 4S” 


SS 


第 二 个 蛋 板 对 45" 方 网 线 有 节 大 啊 应 
第 三 个 模板 对 垂直 线 有 最 大 啊 应 
第 四 个 模板 对 -45" 方 向 线 有 最 大 响应 


< 


< 








间断 检测 


e。 线 检 训 
“ 用 Ri, Ra Rs 和 R4 分 别 代 表 水 平 、45"、 垂 生 和 
-45" 方 网线 的 模板 啊 应 ， 在 图 像 中 心 的 点 ， 如 
本 | 四 >|Ri7 关 
则 此 点 被 认为 与 在 模板 ji 方向 上 的 线 更 相关 
v 例 ， 如 果 民 |> 民 让 7= 23,4 
则 访 点 与 水 平 线 有 更 大 的 关联 
~ 在 灰 度 恒定 的 区 域 ， 上 述 4 个 模板 的 啊 应 为 


全 





沪 





a 
总 妈 训 团 吧 
， 值 电路 接线 模板 》 FIGURE 10.4 
上 Ilustration of line 
一 找 方 向 为 -4$o 的 线条 detection. 
(a) Binary wire- 
bond mask. 
(bj Abpsolute 
value of result 
after processing 
WwWith 一 43? line 
detector. 
(c) Result of 
thresholding 
Image (b). 


使 用 国 值 方法 ， 国 
值 等 于 图 像 中 最 大 


















量 昌 -4So 模 
得 到 结 值得 到 的 结果 ， 一 


些 孤 立 氮 使 用 氮 模 
板 检 测 删除 ， 或 用 
形态 学 腐蚀 法 删除 


间 上 断 检 测 
e。 这 绿 检 训 


~ 什么 是 馆 绿 ? 


一 组 相连 的 像 系 集合 ， 这 些 像 了 系 位 于 两 个 区 
域 的 边界 上 


一 阶 导 数 和 二 阶 寻 数 在 识别 图 像 边 缘 中 的 应 
用 





数字 边缘 模型 


理想 数字 边缘 模型 斜坡 数字 边缘 模型 


Model of an ideal disital edge Model of a ramp digital edge a b 


FIGURE 10.5 

(a) Model of an 
ideal disital edge. 
(b) Model of a 


ramp edge. The 
slope of the ramp 
1S Proportional to 
the desree of 
blurring in the 
edge. 








Gray-level profile Gray-level profile 
of a horizontal line of a horizontal line 
through the image throusgh the image 


斜 圾 的 产生 是 由 光学 系统 、 取 样 和 图 像 采 集 系统 的 不 完善 市 来 
的 边缘 模糊 造成 的 





间 晰 检测 


a bb 


FIGURE 10.6 

(a) Two regions 
separated by a 
vertical edse. 

(Pb) Detail near 
the edse,.showing 
a sray-level 
profile. and the 
first and second 
derivatives of the 
Profile. 










Gray-level Prof1 


First 
derivative 


在 边缘 斜面 上 ， 一 阶 导数 为 正 ， 了 


具 筷 区 域 为 零 Second 
在 边缘 与 黑色 交界 处 ， 二 阶 导数 为 正 
在 边缘 与 亮色 交界 处 ， 二 阶 导 数 为 负 
沿 着 笛 坡 和 灰 度 为 负数 的 区 域 为 零 





间断 检测 


@ 全 T 


一 阶 导 数 可 用 于 检测 和 图 像 中 的 一 个 点 是 否 在 
边缘 上 


~ 二 阶 导数 可 以 判断 一 个 边缘 像素 是 在 边缘 亮 
的 一 边 还 是 蜡 的 一 边 


~ 一 条 连接 二 阶 寻 数 正 值 和 负 值 的 虚构 二 线 将 
在 边缘 中 所 附近 罕 过 零 后 

~ 一 阶 寻 数 使 用 梯度 算 子 ， 二 阶 导 数 使 用 拉 普 
拉 斯 算 子 








边缘 检测 


。 人 迟 度 算 于 
~ 图 像 f(x, y) 在 位 置 (x, y) 的 梯度 定义 为 下 列 


问 量 








O) 


V1 太 = 11108 (VF)= 区 6 


C， 
2 (x， y) = arctan 加 





边缘 检测 





eRoberts 区 叉 概 算 子 
Vf =|G.|+|G，| 


| 加 Zr 是 攻 一 全 





僻 度 计算 由 两 个 蛋 板 组 成 ， 第 一 个 求 
得 梯度 的 第 一 项 ， 第 二 个 求 得 棉 度 的 
第 二 项 ， 然 后 求 和 ， 人 得 到 桔 度 。 


v 两 个 模板 称 为 Roberts 
区 义 柳 度 复 了 二 十 








边缘 检测 








e Prewitt 梯 度 算 子 一 一 3x3 的 梯度 模板 
vf cj+lG， 
=| (z7 +z8 + Z9) 一 (人 Z1+ 2 + 2Z3) | + 
(za3 +Z6 十 Z9) 一 (2 2Z4 二 2Z7) | 








边缘 检测 


e。 Sobel 榜 度 算 子 一 一 3X3 的 梯 度 模板 


权 信 2 用 于 通过 增加 中 心 点 的 重要 性 而 实现 采种 
程度 的 平滑 效 末 








Vf = |16|1+|G.| 
| 
攻 C 二 2 /全 人 呈 ) 








边缘 检测 
e 结论 


~ Prewitt 和 Sobel 算 子 是 计算 数字 梯度 时 最 各 
用 的 算 子 


~ Prewitt 模 板 比 Sobe1 模 板 简单 ， 但 Sobel 模 
板 能 够 有 效 抑制 噪声 





|G|，x 方 向 上 的 柳 度 分 量 ， 


边缘 检测 原 图 像 水 平 细节 非常 清 想 


a b 

| cd 

FIGURE 10.10 

(a) Oripinal 
imase.(b) |G|. 
component of the 
gradient in the 
X-direction. 

(Cc) |GC， 
component in the 
ydirection. 

(d) O@radient 
imase,|G| + |G| 








|G,|，y 方 向 上 的 梯度 分 量 ， cppyamanga 
垂直 细节 非常 清 芭 垂 百 细节 都 非常 清楚 
问题 : 破 场 等 图 像 细节 对 边 绿 提取 不 必要 
处 理 办 法 : 对 图 像 进行 平滑 处 理 





边缘 检测 


原 图 像 经 过 5X5 的 均值 滤 “|G|，x 方 癌 上 的 梯度 分 量 ， 
流 器 进行 平滑 处 理 突出 水 平 细 市 





a hb 

绍 虽 

FIGURE 10.11 
same SeqUence as 
in Fio. 10.10. but 
with the oripginal 
Image Smoothed 
withas X 5 
averasing flter. 








|G|，y 方 向 上 的 梯度 分 量 ， 梯度 图 像 |G,|H|G,|， 突 出 水 平和 
突出 垂直 细节 系 直 细节 














边缘 检测 








Sobel45。 模 板 的 检测 绪 Sobel-45o。 模 板 的 检测 续 





a b 
FIGURE 10.12 


Diasonal edse 
detection. 

(a) Result of using 
the mask In 

Fis. 10.9(c). 

(b) Result of using 
the mask In 

Fig. 10.9(d). The 
input In both cases 
was Fig. 10.11(a). 


拉 普 拉 斯 算 子 
e。 图 像 函 数 的 拉 普 拉 斯 变换 定义 为 
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FICURE 10.13 
Laplacian masks 
Used to 
Implement 
Edqs.(10.1-14) and 
(10.1-13), 
Tespectively 











拉 普 拉 斯 算 子 
@@ 拉 普 拉 斯 算 子 总 络 
~ 缺点 : 
> 拉 普 拉 斯 算 子 对 噪声 具有 敏感 性 
> 拉 普 拉 斯 算 子 的 幅 值 产生 双边 缘 
> 拉 普 拉 斯 算 子 不 能 检测 边缘 的 方 加 
v 优点 : 
> 可 以 利用 零 交 叉 的 性 质 进行 边缘 定位 


> 可 以 硝 定 一 个 像 系 是 在 边缘 蜡 的 一 按 还 是 觉 的 
二 





拉 普 拉 斯 算 子 


e 拉 普 拉 斯 算 于 与 平 请 过 程 一 起 利用 零 交 
文 找到 这 绿 
吕 7 -ez 产 =2+ 六 
5 是 你 准 关 


忆 人 
ra0- 全 | 2 
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上 云 称 为 高 期 型 的 拉 普 拉 期 算 子 LoG 





拉 普 拉 斯 算 子 




















图 像 ， 白 色 是 正 值 区域 ， 黑 色 是 负 值 区 域 ， 
灰色 是 零 值 区 域 


a hb 
全 国 


FIGURE 10.14 
Laplacian of a 
Gaussian (LoG ). 
(a) 3-D Plot. 

(b) Imase (black 
is negative. oray 1S 
the zero Plane、 
and white 1S 
Positive ). 

(c) Cross Section 
Showing Zero 

V2 CTrOSSings， 

(d)S XSmask 
approximation to 
the shape of (al). 


近似 的 $ 久 5 模板 : 一 个 正 的 
中 心 项 ， 周 围 是 一 个 相 邻 的 
负 值 区 域 ， 并 被 一 个 零 值 的 
二 外 部 区 域 包 围 。 系 数 的 总 和 
为 零 


三 维 曲 线 











拉 普 拉 斯 算 子 

局 斯 型 拉 普 拉 斯 算 了 于 总结 
v 融 期 型 图 数 的 目的 是 对 图 像 进行 平 请 
处 理 


v 拉 普 拉 斯 算 子 的 目的 是 近 供 一 幅 用 稚 
区 文 确定 边缘 位 置 的 图 候 
“ 平 请 处 理 减 少 了 噪声 的 影 啊 












空间 高 斯 型 平滑 函数 4 







交往 测 | 边缘 ， 寻找 零 交 
人 去 ， 检 测 黑 色 和 白 


G 检 测 结 
本 和 色 区 域 之 间 的 过 液 点 












的 结果 ， 所 有 正 值 区 
域 为 白色 ， 所 有 负 值 区 域 为 黑色 





拉 普 拉 斯 算 子 
e 结论 〈 对 比 二 阶 拉 普 拉 斯 算 子 和 一 阶 
Sobel 榜 度 算 子 ) 
~ 缺点 
> 边缘 由 许多 闭合 环 的 零 交 叉 点 决定 
> 零 交叉 点 的 计算 比较 复杂 
v 优 点 
; 零 交 叉 点 图 像 中 的 边缘 比 梯度 边缘 细 
> 抑制 噪声 的 能 力 和 反 于 扰 性 能 
vv 结论: 棉 度 算 子 具有 更 多 的 应 用 








图 像 分 割 


。 概述 

e 间断 检测 

e。 边缘 连接 和 边界 检测 
e 贱 值 处 理 

e 基于 区 域 的 分 割 

e 分 割 中 运动 的 应 用 





图 像 分 割 





e。 边缘 连接 和 边界 检测 

~ 为 什么 需要 边缘 连接 ? 
~ 局 部 处 理 

~ 整体 处 理 之 霍 夫 变换 





图 像 分 割 


。 为 什么 需要 边缘 连接 ? 

~ 由 于 噪声 、 照 明 等 产生 亡 缘 间 断 ， 使 得 一 组 
像 系 难以 完整 形成 边缘 

因此 ， 在 边 绿 俭 负 算 法 后 ， 使 用 连接 过 程 将 
间断 的 边缘 像 系 组 合成 完整 边缘 








图 像 分 割 


e 局 部 处 理 


分 析 图 像 中 每 个 边缘 点 (x, y) 的 一 个 邻 域内 
的 像素 ， 根 据 某 种 准则 将 相似 点 进行 连接 ， 由 
满足 该 准则 的 像素 连接 形成 边缘 
如何 确 定 边 缘 像 素 的 相似 性 

> 边缘 像 兹 梯度 算 子 的 啊 应 强度 

> 边缘 像 兹 梯度 算 子 的 方 回 





图 像 分 割 


e。 边缘 像素 梯度 算 子 的 啊 应 强 虔 
如 果 |Yf(ey)-Vf(oo,yojsE 


则 (zx, y) 邻 域内 坐标 为 (xu yo) 的 边缘 像素 ， 在 幅 
度 上 相似 于 (4x, y) 的 像素 


e 边缘 像 系 榜 度 算 于 的 方 回 
如果 cl y)- cz(x0， y0j < 人 4， cx， y 一 so 全 | 


则 Cxy) 邻 域内 坐标 为 (koyo) 的 边缘 像素 ， 在 角度 
上 相似 于 (xy) 的 像素 








边缘 局 部 处 理 例子 


原始 图 像 : 检测 车 牌 牌照 Sobe] 算 子 的 G, 分 量 


ab 

BEQ 

FIGURE 10.16 

(a) Input Imasge. 
(bj Cyv component 
of the gradient. 
(C) CCcomponent 
of the gradient， 
(d) Result of edse 
linking.(Courtesy 
of Perceptics 
Corporation.) 


美国 牌照 的 长 宽 
比例 是 2:1 








通过 Hough 变 换 进行 整体 处 理 


e Hough 玻 换 
~ 问题 的 提出 
~ Hough 变 换 的 基本 思想 
算法 实现 
~ Hough 变 换 的 扩展 








通过 Hough 变 换 进行 整体 处 理 


> Hough 变 换 问 题 的 提出 
” 在 找 出 边界 点 集 之 后 ， 需 要 连接 ， 形 
成 完整 的 边界 图 形 摘 述 








通过 Hough 变 换 进行 整体 处 理 


e Hough 变 换 的 基本 思 息 
对 于 边界 上 的 n 个 点 的 点 集 ， 找 出 共 线 
的 点 集 和 直线 方程 。 
w 对 于 任意 两 点 的 直线 方程 : y = ax + 
b， 构 造 一 个 参数 a，b 的 平面 ， 从 而 有 
如 下 结论 : 


一 一 





通过 Hough 变 换 进 行 整体 处 理 
e Hough 变 换 的 基本 思想 


~ xy 平面 上 的 任意 一 条 直线 y = ax 十 
b ， 对 应 在 参数 ab 平面 上 都 有 一 个 点 
但 





， 过 xy 平面 一 处 点 (x. 册 的 所 有 直线 ， 构 
成 参数 ab 平面 上 的 一 条 直线 


一 








通过 Hough 变 换 进 行 整体 处 理 
e Hough 变 换 的 基本 思想 


如 打点 (xb yU) 与 点 (xo yz) 共 线 ， 那 么 这 两 操 
ed 个 交 扣 , 具有 相 





久 
vv 在 参数 ab 平面 上 相交 下 线 最 多 的 点 ， 对 应 的 
xy 平面 上 的 直线 吏 是 我 们 的 解 








通过 Hough 变 换 进行 整体 处 理 


e Hough 变 换 的 基本 思 礼 








通过 Hough 变 换 进行 整体 处 理 


e Hough 变 换算 法 实现 

“ 由 于 垂直 直线 a 为 无 押 大 ， 我 们 改 用 极 坐 标 
形式 : xcos 0 + ysin0 = p 

“ 参数 平面 为 6,pP ， 对 应 不 是 直线 而 是 正 弱 曲 
线 

“ 使 用 区 扣 芭 加 内 ， 或 交 氮 统计 直方 图 ， 找 出 
相交 线段 最 多 的 参数 空间 的 操 

“ 然后 找 出 该 点 对 应 的 xy 平面 的 直线 线段 








通过 Hough 变 换 进行 整体 处 理 


eHougph 变 换 的 扩展 
~ Hough 故 换 不 只 对 直线 ， 也 可 以 用 于 
员 : 
和 
“ 这 时 需要 三 个 参数 的 参数 空间 


2 








图 像 分 割 


。 概述 

e 间断 检测 

e。 过 绿 连接 和 边界 检测 
e。 贱 值 处 理 

e 基于 区 域 的 分 割 

e 分 割 中 运动 的 应 用 





图 像 分 割 

e 国 值 处 理 
~ 基础 
~ 基本 全 局 国 值 
~ 基本 目 适 应 国人 
~ 最 佳 全 局 和 目 适 应 阔 值 
“通过 边界 特性 选择 国人 
~ 基于 不 同 变量 的 国 值 














a hb 


FIGURE 10.26 人 a) Gray-level hiytosrams that can be Partitioned by (a) a single thresh- 
old,and (b) ntultiple thresholdy. 


暗 的 背景 : fx,y) 入 TI1 
亮 的 一 个 对 象 : Tixfoxy) 乏 了 
亮 的 另 一 个 对 象 : fox,y) > T， 


上 暗 的 背景 : fx 入 IT 


亮 的 对 象 : fgx,y) > 工 





况 值 处 理 


e 基础 
~ 效 值 处 理 操作 
T=7lzyptz 冰 Ac 
f(x, y) 是 点 (zx y) 的 灰 上 度 级 ，p (zx, y) 表示 广 点 


的 局 部 性 质 ， 如 以 4 人 zx, 7) 为 中 心 的 邻 域 的 平均 
灰 度 级 


~ 国信 处 理 后 的 铬 像 gx, 只 定义 为 


1 Feyj>7 
sc- Ts 








况 值 处 理 


e 基础 


1 jeyj>T7 
sy | As 


~ 标记 为 1 的 像素 对 应 于 对 象 ， 标 记 为 0 的 像素 
对 应 于 背景 


~ 当 T 仅 取 雇 于 fx yY) ， 国 值 称 为 全 局 的 
“ 当 T 取 雇 于 fx yY) 和 pktx, yY) ， 国 但 古 局 部 的 


~ 当 T 取 决 于 空间 坐标 x 和 y， 国 值 就 是 动态 的 
或 目 适 应 的 








图 像 分 割 
。 荃 本 全 局 国信 例子 











CS 








下 
国医 


FIGURE 10.28 
(a) Oriclinal 
Image.(b) Imasge 
histosranm1. 

(c) Result of 
global 
thresholding with 
了 midway 
between the 
maximum and 
minimum gray 
levels. 





图 像 分 制 
e。 计算 基本 全 局 国信 算法 


1 


忆 





选择 一 个 IT 的 初始 佑 计 值 


用 T 分 割 图 像 ， 生 成 两 组 像素 : G; 由 所 有 灰 度 值 大 
于 TI 的 像素 组 成 ， 而 G* 由 所 有 灰 度 值 小 于 或 等 于 T 的 
像素 组 成 


对 区 域 O 和 G* 中 的 所 有 像 叉 计算 平均 灰 度 值 由 和 
计算 新 的 国 值 7 = 村 (wi +L42 ) 


重复 步骤 2 到 4， 直 到 逐次 迭代 所 得 的 T 值 之 兰 小 于 
事先 定义 的 参数 T， 


利用 基本 全 局 园 值 算法 的 例子 








a hb 


本 所 2 va eq、 3 C 
EN 原 图 的 直方 图 FlIGURE 10.29 
让、 ra 2 ss 器 joinaz 
BE ae 
listosram. 
C esSsU 0 . 















基本 全 局 国 值 算法 
处 理 的 结果 

TO0=0，3 次 迭代 得 到 
值 为 125.4 

最 后 确定 T=125 





图 像 分 割 


。 基 本目 适应 国 但 
” 单一 全 局 国 值 存在 的 问题 

> 不 均匀 亮度 图 像 无 法 有 效 分 钊 
v 方法 





> 将 图 像 进一步 细 分 为 子 独 像 ， 并 对 不 同 的 子 图 
像 使 用 不 同 的 国 值 处 理 


> 解决 的 关键 问题 : 如 何 将 冬 像 进行 细 分 和 如 何 为 
得 到 的 子 图 像 估计 贱 值 


> 目 适 应 国 值 : 取 次 于 像 陛 在 子 独 像 中 的 位 置 











基本 自 适 应 阔 值 举例 


原 图 


分 刘 为 了 图像: 4 等 分 后 自 适应 阔 值 处 理 的 结果 


再 4 等 分 


一 个 全 局 国 值 处 理 后 的 结果 : 
人 工 设置 二 方 图 的 疲 谷 为 国 值 


a b 

c d 

FIGURE 10.30 
(a) Original 
Imase.(b) Result 
of global 
thresholding. 





(c) Imasge 
subdivided into 
Individual 
SUblimages 

(d) Result of 
adaptive 
thresholding. 



















图 像 分 割 
。 最 佳 全 局 和 目 适 应 六 


” 假设 一 幅 图 像 仪 包含 两 个 主要 的 灰 度 级 区 域 。 令 z 
表示 灰 度 级 值 ， 则 两 个 灰 度 区 域 的 百 方 图 可 以 看 作 它 
们 概率 密度 函数 (PDF) 的 估计 p(42z) 


 p(Z) 是 两 个 密度 的 和 或 混合 。 一 个 是 图 像 中 亮 区 域 
的 密度 ， 万 一 个 是 蜡 区 域 的 密度 


“如 末 p(Z) 已 知 或 假 ， 则 它 能 够 确定 一 个 最 佳 国 值 
《有 共有 了 最 低 的 误 兰 ) 将 图 像 分 割 为 两 个 可 区 分 的 区 城 











最 佳 全 局 和 自 适 应 冰 值 


假设 2 个 PDF 中 较 大 的 一 个 对 应 背景 的 灰 度 级 ， 较 小 的 
一 个 描述 了 图 像 中 对 象 的 灰 度 级 ， 则 刘 合 PDF 是 
网 一 站 六 (oj+ 已 P2 (e 
P, 是 属于 对 象 像素 的 概率 ，P, 是 属于 背景 像 了 的 概率 ， 
假设 图 像 只 包括 对 象 和 背景 ， 则 
石上 已 =] 





了 5 _ 恒 . 
同 时 、 


FIGURE 10.32 ESE 旬 
GrayV- evel 











最 佳 全 局 和 自 适应 阔 值 信 ) 


在 区 间 [a, bj] 内 取 值 的 随机 变量 的 概率 是 它 的 概率 密度 
图 数 从 a 到 pb 的 积分 ， 即 在 这 两 个 上 下 限 之 间 PDF 曲 线 围 住 
的 面积 ， 因 此 ， 将 一 个 背景 点 当 作 对 象 点 进行 分 类 时 ， 错 
误 发 生 的 概率 为 : 
瑟 ( 信 = | Pa(zjdc 
这 是 在 曲线 px(z) 下 方位 于 阔 值 左边 区 域 的 面积 
“ 将 一 个 对 象 点 当 作 背 景点 进行 分 类 错误 发 生 的 概率 为 


瓦 们 =| 站 灾 


这 是 在 曲线 pi(Z) 下 方位 于 国信 右边 区 域 的 面积 





最 佳 全 局 和 自 适 应 冰 值 


出 钳 率 的 整体 委 率 是 
妃 7)= 已 瑟 ( 站 + 人 7 


~ 为 了 找到 出 错 最 少 的 国 值 ， 使 用 散布 尼 效 法 则 
把 E(T) 对 T 求 微分 并 令 结果 等 于 0， 得 到 


已 (7) 五 忆 (7 
“ 上 式 解 出 T， 即 为 最 佳 冰 值 


~ 如 条 Pi=P*， 则 最 佳 国 值 位 于 曲线 pl\4z) 和 py〈Z) 
的 交 氮 处 





最 佳 全 局 和 目 适 应 国人 
~” 忆 期 密度 可 以 用 两 个 参数 均值 和 方 关 手 述 


_(z-A) (z-p) 
( 二 忆 已 2o2 


一 忆 十 C 
2 OJ V27O) 


“ 出 钳 最 少 的 国信 T 的 解 
47 “+BT7+C=0 














站 证 区 二 区 
2 
必 = ?ua3 wa 
C=ofrl -aiA+2orczntc2P1ciP2) 








最 佳 全 局 和 自 适应 阔 值 < 
“ 如 朱 方 震 相 等 呈 = 只 = 到 ， 则 得 到 单一 的 国 但 


2 
忆 
7 -9 全 | 
< MA 下 站 


“ 如 条 Pi=P*， 节 佳 国 值 是 均值 的 平均 数 








图 像 分 割 
e 通过 边界 特性 选 摔 国 信 





> 如 打下 方 图 的 各 个 波峰 很 局、 很 罕 、 对 
称 ， 且 被 很 深 的 波 谷 分 开 时 ， 有 利于 选择 
国 但 

> 为 了 改善 百 方 图 的 波峰 形状 ， 我 们 只 把 区 
域 边 绿 的 像素 给 入 直方 图 ， 而 不 考虑 区 域 
中 间 的 像 妹 
和 界 中 心 两 边 的 人 








图 像 分 割 

e 通过 边 弄 特性 选择 国 什 

~ 这 种 方法 有 以 下 优 氮 : 
JU 在 前 景 和 痛 景 所 喇 区 域 面 积 关 别 很 大 时 ， 
个 会 造成 一 个 灰 度 级 的 让 峰 过 高 ， 而 万 一 
OUIR 
2) 边缘 上 的 点 在 区 域内 还 是 区 域外 的 概率 是 
相等 的 ， 因 此 可 以 增加 波峰 的 对 称 性 
3) 基于 梯度 和 拉登 拉 斯 算 子 选择 的 像 了 系 ， 可 
以 增加 肖 峰 的 高 度 








图 像 分 制 


e 通过 边 弄 特性 选择 国 但 

“ 算法 的 实现 ; 
1) 对 图 像 进行 梯度 计算 ， 得 到 梯度 图 像 。 
2) 得 到 梯度 值 最 大 的 那 一 部 分 〈 比 如 10% 

的 像素 直方 图 

3) 通过 和 直方 图 的 谷底 ， 得 到 国 什 T 

“ 如 采用 拉 普 拉 斯 算 于 ， 不 通过 直方 向 ， 直 接 
得 到 国 什 ， 方 法 是 使 用 拉 普 拉 斯 算 子 过 波 疼 
像 ， 将 0 跨越 点 对 应 的 灰 度 值 为 国 什 1 





图 像 分 割 
。 基于 不 同 变 量 的 国信 


v 在 某 些 情况 下 ， 传 感 器 可 以 产生 不 止 一 个 在 图 像 中 
描述 每 一 个 像素 的 可 利用 的 变量 ， 因 此 ， 人 允许 进行 多 
谱 段 冰 值 处 理 


~ 例如 一 幅 有 3 个 变量 的 图 像 RGB 分 量 ) ， 每 个 像素 有 
16 种 可 能 的 灰 度 级 ， 构 成 16X16X16 种 灰 度 级 〈 网 
格 ， 立 方 体 ) 

~ 国 值 处 理 就 是 在 三 维 空 间 内 寻找 点 的 聚 徐 的 过 程 。 
如 在 直方 图 中 找到 有 效 点 复 K， 可 以 对 RGB 分 量 值 接近 
某 一 个 复 的 像素 赋予 一 个 任意 值 ( 如 和 白色 的 值 ) ， 对 其 
它 像 素 赋予 另 一 个 值 〈 如 黑色 的 值 ) 


~ 彩色 图 像 处 理 中 的 色调 和 饱和 度 易于 图 像 分 害 





人 


基于 不 同 变量 交 值 的 处 理 





对 应 于 红色 轴 的 一 个 复 
进行 阔 值 处 理 得 到 ， 红 色 的 
围 由 和 花 出 现在 分 割 结果 中 





彩色 照片 的 单 色 图 像 “对 应 于 脸 部 色调 的 一 
个 复 进 行 浆 值 处 理 得 到 








FIGURE 10.39 (a) Original color Imagpe shown as a monochrome picture.(b) Sesmentation of PiIXels with col- 
orS close to facial tones.(c) Sesgmentation of red components. 


v 原 彩 色 图 是 由 16 位 RGB 图 像 组 成 的 
v 围巾 是 鲜红 色 ， 头 发 和 脸 部 的 凑 色 很 浅 








图 像 分 割 


。 概述 

e。 间断 检测 

e。 边 缘 连 搁 和 边 弄 检测 
e。 闵 值 处 理 

e。 基于 区 域 的 分 割 

e。 分 割 中 运动 的 应 用 





图 像 分 割 


e。 基于 区 域 的 分 割 
AAA 

~ 区 域 生 长 

~ 区 域 分 离 与 合并 





图 像 分 割 


e 基本 概念 
~ 目标 : 将 区 域 R 划 分 为 看 和 干 个 子 区 域 
Ri, R，..…，,R， 这 些 子 区 域 满足 5 个 条 
件 ; 
1) 完备 性 : UR 二 人 


1 一 ] 





2) 连 通 性 : 每 个 Ri 都 是 一 个 连通 区 域 
3) 独立 性 ;对 于 任意 ji 和夫 j，RimR= 
中 





图 像 分 割 


e。 基本 概念 
4) 单一 性 : 每 个 区 域内 的 灰 度 级 相 


等 ， 
P (CRi) = TRUE，i = 1 2， 


5) 互 斥 性 : 任 两 个 区 域 的 灰 区 度 级 不 
等 ，P CRiURi) = FALSE，i 天 jj 











图 像 分 割 


e 区 域 增 长 的 算法 实现 : 

1) 根据 图 像 的 不 同 应 用 选择 一 个 或 一 组 种 
子 ， 它 或 者 是 最 完 或 最 上 暗 的 点 ， 或 者 是 位 
于 点 复 中 心 的 点 

2) 选择 一 个 描述 符 《〈 条 件 ) 

3) 从 该 种 子 开始 同 外 扩张 ， 首 先 把 种 子 像 素 
加 入 结果 集合 ， 然 后 不 断 将 与 集合 中 各 个 
像素 连通 、 且 满足 描述 符 的 像素 加 入 集合 
4) 上 一 过 程 进行 到 不 再 有 满足 条 件 的 新 结 点 
加 入 集合 为 止 





图 像 分 割 


e 通过 像素 集合 的 区 域 增 长 
~ 算法 实现 : 











图 像 分 割 


@ 区 域 分 型 人 
“ 算法 实现 : 


1) 对 图 像 中 灰 度 级 不 同 的 区 域 ， 均 分 为 四 
个 于 区 域 











图 像 分 割 





e 区 域 分 袋 与 合并 
算法 实现 : 
2) 如 果 相 邻 的 子 区 域 押 有 像 冰 的 灰 度 
级 相同 ， 则 将 其 合 
3) 反复 进行 上 两 步 操作 ， 直 至 不 再 有 
新 的 分 黎 与 合并 为 止 





图 像 分 割 


e 区 域 分 作 与 合并 
V 算法 实现 : 














图 像 分 割 


e 区 域 分 袋 与 合并 
算法 实现 : 实际 应 用 中 还 可 作 以 下 
修改 : 
PCRi) 的 定义 为 
1) 区 域内 多 于 80% 的 像素 满足 不 等 式 
2 一 mi | 《=2 0 ji， 
其 中 : 2 是 区 域 Ri 中 第 j 个 点 的 灰 度 级 ， 
mi 古 该 区 域 的 平均 灰 度 级 ， 
0 ji 是 区 域 的 灰 度 级 的 标准 方差。 
2) 当 PGRi)=TRUE 时 ， 将 区 域内 所 有 像素 的 灰 度 
级 置 为 m; 








图 像 分 割 


。 概述 

e 间断 检测 

e。 过 绿 连接 和 边界 检测 
e。 贱 值 处 理 

e 基于 区 域 的 分 割 

e。 分 割 中 运动 的 应 用 








分 割 中 运动 的 应 用 


e 空 团 技术 


w 使 用 两 帆 图 像 f4xz y tp) 和 f(x ytiD) 相 减 的 办 法 ， 
形成 关 值 图 像 
ut 0 了 
由 
~ 在 动态 图 像 处 理 过 程 中 ，dij 中 值 为 1 的 像素 被 认为 
是 对 象 运动 的 结 
v 考虑 图 像 邮 序 列 f(x, y, tl) ,fx yt2) 


fx y, tn) ,并 令 f(x y, tl 为 基本 疼 像 ， 一 幅 素 积 差 噶 
图 像 (ADID) 由 基准 疼 像 和 图 像 序列 的 后 续 图 像 对 比 得 到 








分 割 中 运动 的 应 用 
空间 技术 〈 续 ) 


w 令 R(x, y) 表 示 基 准 图 像 ， 绝 对 ADI， 正 ADI 和 负 ADIT 
定义 如 下 : 
AL， 4 惠 人 y)+1 |R( y)- F(x yy 天) ~ 人 
4 (xy 其 它 


作 -1 fx， yj+1 [R(x y 
己 一 
1 人 -1 kx， y 其 沙 








分 割 中 运动 的 应 用 


e 衬 半 技术 举例 
问 东 南方 回 运动 的 算 形 目标 的 ADI 








绝对 ADI 正 ADI 负 ADI 
AR ADIs of a sular object n )utheasterly direction.(a) Absolute ADI.(b) Posi- 


ADI (c) Negative ADL 








数字 图 像 处 理 〈11) 


任何 问题 ? 
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表示 与 描述 


e。 概述 

e。 表示 方法 
e 边 弄 拍 述 子 
e。 天 系 描 述 子 








表示 与 拍 述 
。 概述 


v 图 像 分 割 结果 是 得 到 了 区 域内 的 像素 集合 ， 或 位 于 
区 域 边界 上 的 像素 集合 ， 这 两 个 集合 是 互补 的 


~ 与 分 割 基 似 ， 图 像 中 的 区 域 可 用 其 内 部 (如 组 成 区 域 
的 像素 集合 ) 表 示 ， 也 可 用 其 外 部 《如 组 成 区 域 边 界 的 
像 系 集合 ) 表示 

~ 一 般 来 议 ， 如 条 关心 的 是 区 域 的 反射 性 质 ， 如 灰 
度 、 颜 色 、 纹 理 等 ， 和 用 内 部 表示 法 ， 如 有 关心 的 是 
区 域 形 状 ， 则 选用 外 部 表示 法 

“ 和 表 示 和 是 百 接 具 体 地 表示 目标 ， 好 的 表示 方法 应 具有 
省 存储 空间 、 多 于 特征 计算 等 优 氮 











表示 与 描述 
e 爸 还 


摘 述 是 较 抽 象 地 表示 目标 。 好 的 摘 述 应 在 及 可 能 区 
列 不 同 目标 的 基础 上 对 目标 的 太 度 、 平 移 、 旋 转 等 不 
人 敏感， 这样 的 掏 述 比较 通用 

~ 手 述 可 分 为 对 边界 的 描述 和 对 区 域 的 朱 述 。 些 外， 
边界 和 边界 或 区 域 和 区 域 之 间 的 关系 也 营 需 要 进行 描 
述 

“ 表示 和 朱 述 是 密切 联系 的 。 表 示 的 方法 对 朱 述 很 重 
要 ， 因 为 它 限 定 了 摘 述 的 精确 性 ;而 通过 对 目标 的 摘 
述 ， 各 种 表示 方法 才 有 实际 意义 


“ 和 表 示 和 描述 勾 有 区 别 ， 和 示 侧重 于 数据 结构 ， 而 摘 
述 侧重 于 区 域 特性 以 及 不 同 区 域 间 的 联系 和 关 别 


表示 与 拍 述 
。 概述 


w 对 目标 特征 的 测量 是 要 利用 分 割 结果 进一步 从 图 像 
中 获取 有 用 信息 ， 为 达到 这 个 目的 需要 解决 两 个 关键 
问题 : 
> 选用 什么 特征 来 描述 目标 
> 如 何 精确 地 测量 这 些 特 征 
~ 季 见 的 目标 特征 分 为 灰 度 〈 癌 色 ) 、 纹 理 和 几何 形 
状 特征 等 。 其 中 ， 灰 度 和 纹理 属于 内 部 特征 ， 几 何 形 
状 属于 外 部 特征 








表示 与 描述 


。 概述 

e。 表示 方法 
e 边 弄 拍 述 子 
e。 天 系 描 述 子 








表示 与 描述 
e 衣 示 方法 
~ 链 但 
~ 多 边 形 近似 
~ 外 形 特征 
~ 边界 分 段 


~ 区 域 骨 织 





表示 与 朱 述 


e。 链 位 


链 码 用 于 表示 由 顺序 连接 的 具有 指定 长 度 和 方 癌 的 
十 线段 组 成 的 边界 线 


~ 这 种 表示 方法 基于 线段 的 4 或 8 连接 
~ 每 一 段 的 方 稀 使 用 数字 编号 方法 进行 编码 
4 链 码 8 链 码 








a b 
FIGURE 11.1 
Direction 


人 
fMD 


nunmbers for 








1 
{(b) 8-directional 
chain code. 
本 
3 








表示 与 挡 述 
e。 链 但 举例 : 





4- 链 但 : 000033333322222211110011 








表示 与 朱 述 


e 链 位 
~ 算法 : 
> 给 每 一 个 线段 亡 界 一 个 方 同 编码 
> 有 4 链 码 和 8 链 码 两 种 编 但 方法 
> 从 起 点 开始 ， 沿 按 界 编 权 ， 至 起 操 
入 重 新 伴 到 ， 结 束 一 个 对 象 的 编码 








表示 与 描述 
e 链 伍 


~ 问题 1 
1) 链 码 相当 长 
2) 噪音 会 产生 不 必要 的 链 码 
~ 改进 1; 
1) 加 大 网 格 空间 
2) 依据 原始 边界 与 结果 的 接近 程度 ， 
来 确定 新 点 的 位 置 








表示 与 朱 述 


e 链 介 举例 : 





4- 链 码 : 003332221101 





表示 与 描述 
e 链 但 


问题 2: 
1) 由 于 起 点 的 不 同 ， 造 成 编码 的 不 同 
2) 由 于 角度 的 不 同 ， 造 成 编 公 的 不 同 
V 改进 2: 
1) 从 固定 位 置 作 为 起 点 (了 最 左 最 上 ) 开 
始 编 码 
2) 通过 使 用 链 但 的 天 分 代 答 但 字 本 丑 
的 方式 








表示 与 朱 述 


e 链 公 
v 循环 关 分 链 公 : 用 相 邻 链 码 的 震 代 符 链 下 
例如 : 4- 链 码 10103322 
循环 差分 为 :33133030 


循环 差分 : 1 -2 = -1(3) 3 -0=3 
0-1=-l) 3-3=0 
1-0=1 2-3=-1(3) 
0-1=-l3) 2-2=0 








表示 与 朱 述 


e 多 过 形 近似 
~ 基本 囊 力 : 用 最 少 的 多 边 形 线段 ， 


钓 取 边 寞 形状 的 本 质 

“ 村 找 最 小 基本 多 这 形 的 方法 一 般 有 
两 种 : 

1) 氮 合 成 法 


2) 边 分 八 法 








表示 与 挡 述 


e 多 了 边 形 近 似 四 


v 氮 合 成 算法 : 人 

] ) 沿 着 边界 选 两 个 相 邻 的 点 对 ， 计 算 首 尾 连接 直 
线段 与 原始 折线 段 的 误 甜 R。 

2) 如 条 误差 R 小 于 预先 设置 的 国 值 T。 去 拯 中 间 
点 ， 选 新 点 对 与 下 一 相 邻 点 对 ， 重 复 1) ; 人 否 
则 ， 存 储 线段 的 参数 ， 置 误 关 为 0， 选 家 存储 线 
段 的 终点 为 起 点 ， 重 复 1) 2) 。 

3) 当 程 序 的 第 一 个 起 点 被 遇 到 ， 算 法 疆 





表示 与 描述 


e 多 过 形 近似 
“点 合成 算法 思想 举例 : 


cooe oooees 
coo0e oooooc 


国 
ce 一 <o0eooeee 






















表示 与 朱 述 


e 多 边 形 近似 
点 合成 算法 的 问题 : 

> 顶点 一 般 不 对 应 于 边界 的 拐点 〈 如 拐 
角 ) 。 因 为 新 的 线段 直到 超过 误差 的 浆 值 
才 开 始 男 

例如 : 如 果 洛 寿 一 条 长 的 直线 退 踩 ， 而 它 
出 现 了 一 个 扔 角 ， 在 超过 国 值 之 本 ， 抱 角 
上 的 一 些 点 会 被 丢弃 

> 下 面 讲 到 的 分 裂 法 可 用 于 缓解 这 个 问题 





分 八 边 算法 : 
(1) 连接 边界 线段 的 两 个 冰点 〈 如 末 是 封闭 边 
界 ， 连 接 最 远 点 ) ; 
《2) 如 条 最 大 正 交 距离 大 于 国信 ， 将 按 界 分 为 
两 段 ， 最 大 值 点 定位 一 个 顶点 。 重 复 〈1) : 
(3) 如 末 没 有 超过 国信 的 正 交 距离 ， 结 束 。 





表示 与 描述 


e 多 边 形 近似 
“ 这 分 僚 算 法 思想 举例 : 








a b 


C 
蝶 回 
FIGURE 11.4 
(al) Orisinal 
boundary. 
过 五 


(b) Boundary 
divided into 
segments based 
On exXtreme 


\ 入 

区 6 points.(c) Joining 
of vertices. 
(d) Resultinsg 
polygon. 


使 用 直线 ab 长 度 的 0.25 倍 作为 浆 值 的 拆 分 过 程 结 琳 。 由 于 在 新 的 边界 
线段 上 没有 超过 靖 值 的 于 直上 距离 的 点 ， 分 割 过 程 终止 











表示 与 描述 
e 外 形 特征 
外 形 特 征 是 一 种 用 一 维 枉 数 表 达 


边 窜 的 方法 。 基 本 电 想 征 把 边 寞 的 表 
示 降 到 一 维 函 数 













表示 与 朱 述 


e 处 形 特征 
vv 图 数 定 义 质心 角 天 数 : 边 上 的 点 
到 质心 的 距离 Y， 作 为 严 角 0 的 函数 了 (0) 





Fr(O) 
人 


2 元 








外 形 特征 举例 


a hb 

FIGURE 11.5 

Distance-versus- 全 
angle Sionatures. 

In (a) r(9) 18 

constant. In (b)、 

the Sisnature 





consists of | | 4 一 | 
repetitions of the 
pattern r(9) r(9) 
r(9) = 4secbfor 
0 三 0 三 T/4and V24 
r(9) 三 4cscofor 
T/4 < 8 三 古 /2. 4 4 
SO 7 人 7 小 2 下 汉 二 2 








表示 与 朱 述 
e 牙 形 特征 
“ 问题 : 函数 依赖 于 旋转 和 比例 缩放 变 
换 
~ 改进 : 
> 对 于 旋转 一 一 两 种 改进 : 
a. 选择 离 质心 最 远 的 点 作为 起 点 
b. 选择 从 质心 到 主轴 了 最 远 的 点 作为 起 点 
> 对 于 比例 变换 : 
对 函数 进行 正则 化 ， 使 刺 数值 总 是 分 
布 在 相同 的 全 域 里 ， 比 如 说 [0，1 





表示 与 描述 
e 边 春 分 段 
基本 概念 : 

> 一 个 任 划 集合 S$〈 区 二 ) 的 凸 起 外 缘 
H 是 : 包含 S 的 最 小 西 起 的 集合 
> H-S 的 甜 的 集合 被 称 为 集合 S 的 凸 起 
人 簿 集 D 

国 呈 | s 

国 上 7 


S+D= 开 





表示 与 朱 述 


e 边 春 分 段 
V 分 段 算 法 : 





> 给 进入 和 离开 巴 起 补 集 D 的 变换 点 打 
标记 来 划分 边界 段 。 
> 优点 : 不 依赖 于 方 同 和 比例 的 变化 


5 








表示 与 描述 


e 边 守 分 段 举 例 


a b 

FIGURE 11.6 
(a) A repglion. 9， 
and its COnVvex 
deficiency 
{Shaded ). 

(b) Partitioned 
boundary. 


区 域 S$ 和 它 的 凸 起 补 集 D 航 分 割 的 边界 








表示 与 朱 述 





e 边界 分 段 
~ 问题 : 
噪音 的 影响 ， 导 致 出 现 雪 雁 的 划分 。 
和 匈 平 请 边 轩 ， 或 用 多 边 形 吉 近 边 乔 ， 
然后 册 分 段 








表示 与 朱 述 


e 区 工 上 骨 织 
W 基本 思 祖 

> 胡 示 一 个 平面 区 域 结 构 形 状 的 重要 方法 是 把 
它 削 减 成 图 形 。 这 种 削减 可 以 通过 细 化 〈 也 
称 为 抽 上 骨架 ) 算法 ， 获 取 区 域 的 骨架 来 实现 

>*Blun 的 中 轴 变 换 方 法 〈MAT ) 

设 :R 是 一 个 区 域 ，B 为 R 的 边界 点 ， 对 于 R 中 
的 点 p， 找 p 在 B 上 “最 近 ” 的 邻 届 。 如 果 p 有 多 
于 一 个 的 邻居 ， 称 它 属于 R 的 中 轴 《〈 肯 织 ) 








表示 与 朱 述 


e 区 域 骨 架 《〈 续 ) 
“ 问题 : 计算 量 大 
包括 计算 区 域 的 
每 个 内 部 点 到 其 边 
界 点 的 距离 


四 





表示 与 朱 述 


e 区 拭 上 骨 加 

~ 算法 改进 思想 
在 保证 产生 正确 骨 织 的 同时 ， 改 进 算 
法 的 效率 。 比 较 和 典型 的 是 一 次 细 化 算 
法 ， 它 们 不 断 删 除 区域 边 界 点 ， 但 保 
证 删除 满 丰 : 
(1) 不 删除 闪避 
《2) 不 了 破坏 连通 性 
(3) 不 造成 对 区 域 的 过 度 雁 蚀 








表示 与 朱 述 


e 区 域 骨 架 
一 种 细 化 二 值 区域 的 算法 
> 假设 区 域内 的 点 值 为 1， 背 景 值 为 0 
> 这 个 方法 由 对 给 定 区 域 的 边界 点 连 
续 进 行 两 个 基本 操作 构成 
> 这 里 边界 点 是 指 任何 值 为 1 且 至 少 
有 一 个 8 邻 域 上 的 点 为 0 的 像素 





表示 与 摘 述 





@。 区 域 骨 架 





~ 基本 操作 1 es 人 2 竹 


对 于 满足 以 下 四 个 条 件 的 边界 点 打 标记 准备 删除 : 


(aj 2<N(py)<6 其 中 NGpi) 是 点 DI 的 邻 域 中 1 的 个 数 ， 
Ri : NE 二 0 


(b) Spb =1 

其 中 Spb 是 按 py, py .… ps 顺序 ，0-1 园 换 的 个 数 
(c) py .pi .pg= 0 (0p ,pi,pi 至 少 有 一 个 0) 
(d) pi .pi.pg= 0 (pi ,pie,ps 至 少 有 一 个 0) 





表示 与 描述 


e 区 域 骨 织 

所 有 条 件 都 满足 ， 才 打 删 除 标 记 。 删 除 并 不 
头 即 进行 ， 而 是 等 到 对 所 有 边界 点 都 打 完 标记 
后 ， 有 绸 把 作 了 标记 的 点 一 起 删除 








“ 举例 : 

NGpD) = 4 

S(Di) = 3 

px.p4. pe = 有 

ppi.pg = 0 第 2 个 条 件 没 满 足 不 打 标 记 





表示 与 描述 


“ 基本 操作 2 


条 件 \a) 、(\b) 与 操作 1 相同 
条 件 (c) 、 〈d) 改 为 : 

C pp ps= 0 

9 ) pu pi.ps= 0 





表示 与 朱 述 





e 区 工 骨 织 
~ 细 化 算法 
细 化 和 法 的 一 轮 操 作 包 括 : 
> 投 操 作 1， 给 边界 点 打 标 记 一 一 删除 点 
> 投 操 作 2， 给 边界 点 打 标 记 一 一 删除 点 
> 这 个 基本 过 程 反 复 进 行 ， 直 至 没有 操 
可 以 删除 为 止 。 此 时 算法 终止 。 








表示 与 描述 


。 概述 

e。 表示 方法 
e 边 和 弄 拍 述 子 
e。 天 系 描 述 子 








表示 与 描述 


。 边 界 描述 子 
7 简单 描述 子 
7 形状 数 
7， 傅 里 叶 描述 子 


~ 埠 量 








表示 与 朱 述 


e 侧 单 持 述 子 
边 寞 的 周 长 : 
是 最 简单 的 摘 述 符 之 一 。 治 轮廓 线 计算 像素 的 
个 数 ， 给 出 了 一 个 长 度 的 近似 估计 
边界 的 直径 : 边界 B 的 直径 是 : 
Diam(B)= maxlP(pi jj 
7/ 
D 和 是 欧 氏 距离 或 几何 距离 ， Dj， pj 古 边界 上 的 
氮 。 直 径 的 长 度 和 直径 的 两 个 中 点 连 线 〈 这 条 线 航 


称 为 边界 的 主轴 ) 的 方向 ， 是 关于 边界 的 有 用 的 描 
述 符 。 








表示 与 朱 述 


。 简 单 描述 子 
“ 边界 的 直径 举例 





表示 与 朱 述 


K2 
e 和 单质 述 子 3 -~ 


曲率 被 朱 述 为 糙 座 的 变化 率 。 近 似 : 
用 相 邻 过 界线 段 〈 摘 述 为 直线 ) 的 矢 率 天 
作为 在 边界 线 区 点 处 的 曲率 摘 述 子 。 





交点 a 处 的 曲率 为 dk = kl - K2 
其 中 kl1、k2 为 相 邻 线段 的 斜率 








表示 与 朱 述 


e。 侧 单 持 述 子 
~ 边界 的 吓 线 段 氮 : 
当 顶 点 p 上 的 斜率 是 非 负 时 ， 称 其 为 
中 线段 上 的 操 
~ 边界 的 上 四 线段 氮 : 
当 顶 点 D 上 的 和 料 率 为 负 时 ， 称 其 为 四 
线段 上 的 操 





表示 与 朱 述 


形状 数 一 一 链 码 的 实用 化 
v 形状 数 定 义 : 最 小 循环 首 差 链 伍 
循环 首 志 链 但 : 用 相 邻 链 码 的 震 代 符 链 1 
例如 : 4 链 码 10103322 
循环 首 差 为 : 33133030 
循环 首 差 :1 - 2 = -1(3) 3-0=3 
0 -1 = =-1(3) 3=-3=10 
1-0=1 2 -3=-=-1(3) 
0 -1 = =-1(3) 和 





表示 与 朱 述 


e 形状 灵 
vv 形状 数 定 义 : 最 小 循环 首 差 链 码 
例如 : 4- 链 码 : 10103322 
循环 首 莽 ”: 33133|1030 
形状 数 : 03033133 





v 形状 数 序 亏 n 的 定义 : 
形状 数 表 达 形 却 中 的 位 数 。 上 例 序 数 为 8 





表示 与 描述 
e。 形状 数 
~ 序号 为 4、6、8 的 形状 数 举例 : 





厅 己 4 砷 于 6 序 扎 8 


上] [CC 


链 码 : 0321 链 码 :003221 链 码 : 00032221 
首 差 : 3333 首 差 : 303303 首 差 : 30033003 
形状 ; 3333 形状 ; 033033 形状 ; 00330033 





表示 与 朱 述 


e 形状 效 
“ 序号 为 6 的 形状 效 举 例 : 





序号 6 
序号 6 
链 码 : 003221 链 码 : 033211 
首 差 : 303303 首 差 ， 330330 
形状 : 033033 形状 ; 033033 


形状 数 与 方 癌 无 天 





表示 与 朱 述 


e。 形状 效 
“序号 为 8 的 形状 数 举 例 : 


[人 


链 码 : 00332211 ， 链 码 : 03032211 ， 链 码 : 00323211 
首 差 : 30303030 “ 首 差 : 33133030 ” 首 差 ， 30331330 
形状 ; 03030303 “形状 ; 03033133 形状; 03033133 














表示 与 拍 述 
。 形状 效 


问题 : 

虽然 链 码 的 首 竺 是 不 依赖 于 旋转 的 ， 
但 一 般 情 况 下 边界 的 编 但 依赖 于 网 格 的 
方 问 。 
~ 改进 : 

规整 化 网 格 方 同 ， 其 体 方法 如 下 : 








表示 与 朱 述 


形状 数 

~ 儿 个 基本 概念 : 
> 边界 最 大 轴 a: 是 连接 距离 最 远 的 两 个 
点 的 线段 
> 边界 最 小 轴 b: 与 最 大 轴 和 对 下 ， 且 其 长 
度 确定 的 包围 盒 刚 好 包围 边界 。 
> 边界 离心 率 c: 了 最 大 轴 长 度 与 最 小 轴 长 
虚 的 比 c=a /pb 
> 基本 和 失 形 : 包围 边界 的 抢 形 。 








表示 与 朱 述 


e 形状 效 
“ 基本 颁 念 举例 





边界 最 大 轴 a 


边界 最 小 轴 p 








表示 与 拍 述 
。 形状 效 
~ 规整 化 网 格 方 癌 算法 的 中 蛋 : 
大 多 数 情 况 下 ， 将 链 码 网 格 与 基本 和 窍 形 
对 齐 ， 即 可 得 到 一 个 唯一 的 形状 数 。 
规整 化 网 格 方 网 的 一 种 算法 如 下 : 
(1) 首 乞 确定 形状 效 的 序 亏 ni 
《2) 在 序号 为 n 的 窃 形 形 状 数 中 ， 找 出 一 个 己 
给 定形 状 的 基本 矩形 的 离心 率 了 最 接近 的 形状 
数 








表示 与 描述 
e 形状 数 
(3) 然后 再 用 这 个 矩形 与 基本 矩形 对 齐 ， 
构造 网 格 。 
(4) 用 获得 链 码 的 方法 得 到 链 码 ; 
(5) 再 得 到 循环 首 差 ; 
(6) 首 差 中 的 最 小 循环 数 即 为 形状 数 。 
例 : 如 和 果 n=12， 所 有 序 号 为 12 的 矩形 《〈 即 周 
长 为 12) 为 2X4，3X3，1X5。 如 果 2X4 
托 形 的 离心 率 最 接近 于 给 定 边界 的 基本 移 
形 的 离心 率 ， 我 们 建立 一 个 2X4 的 网 格 。 








表示 与 描述 
。 形 状 数 
7， 规整 化 网 格 方向 
算法 举例 : 





SS 
,XC 链 码 : 000033222121 


3 首 差 : 300030300313 
形状 ; 000303003133 








傅 里 时 描述 子 : 将 一 个 二 维 问题 简化 成 一 个 一 
维 问题 
V ] ) 基本 思想 : 


C1) 对 于 XY 平 面 上 的 每 个 边界 点 ， 将 其 坐标 用 复数 
表示 为 : Ss(k) = x(Gk) + jy(k)， k=0,1 ...,N-l 


。 X(k) = XI 
y(k) = 区 





表示 与 拍 述 
e。 信里 叶 描述 子 





ov ] ) 基本 思想 ; 
《2) 进行 离散 傅 里 叶 变 换 
N-1 
au =1/N >s(k)exp(-j2ruk/N) ， u=0, 1 ...,N-l 
U=0 
N-1 
sk) = > aulexp(j2ruk/N) k=0, 1,，...,N-1 
U=U0 


系数 a(u) 被 称 为 边界 的 傅 里 叶 摘 述 子 








表示 与 描述 
e 傅 里 叶 描 述 子 


V | ) 基本 思想 ; 
(3) 选取 整数 PN-1， 进 行道 全 里 叶 变 换 
( 重 构 ) 
P-1 
S"(k) = a(uexp(j27ruk/N) k=0, 1,，...,N-1 
uU=(0 


这 时 ， 对 应 于 边界 的 点 数 设 有 改变 ， 但 
在 重 构 每 一 个 点 所 需要 的 计算 项 大 大 减少 
了 了。 如 末 边 界 氮 数 很 六 ，P 一 般 选 为 2 的 指数 
次 方 的 整数 。 





表示 与 朱 述 


e 傅 里 时 质 述 符 
2) P 的 选取 与 摘 述 符 的 关系 
在 上 述 方法 中 ， 相 当 于 对 于 u > P-1 的 部 
分 舍 去 不 子 计 算 。 由 于 傅 里 时 变换 中 高 频 部 分 
对 应 于 儿 像 的 细 贡 摘 述 ， 因 此 P 取 得 越 小 ， 细 
节 部 分 丢失 得 越 多 。 








表示 与 描述 


原 图 的 方形 边界 


人 








FIGURE 11.14 
Examples of 
reconstruction 
from Fourier 
descriptors. Pis 
the number of 
Fourier 
coefficients Used 
in the Orisginal (天 = 64) 
reconstruction of 
the boundary. 





结论 : 低 阶 系数 能 够 反映 大 体形 状 ， 高 阶 系数 可 以 精确 定义 形状 特征 ， 
少数 傅 里 叶 描述 子 携带 了 形状 信息 ， 能 够 反映 边界 的 大 略 本 质 。 





表示 与 朱 述 


e 傅 里 叶 质 述 符 
~ 3) 使 用 价值 

(1) 较 少 的 傅 里 叶 描述 子 〈 如 4 个 ) ， 束 
可 以 获取 边界 本 质 的 整体 轮 廊 

62) 这些 带 有 边界 信息 的 描述 子 ， 可 以 
用 来 区 分 明显 不 同 的 边界 





表示 与 描述 

。 傅 理 于 插 述 行 

~ 4) 优点 

GT) 使 用 复数 作为 描述 符 ， 对 于 旋转 、 平 移 、 缩 放 等 操 
作 和 起 始点 的 选取 不 十 分 敏感 。 

《2) 几何 变换 的 描述 子 可 通过 对 函数 作 简 单 变 换 来 获得 


几何 变换 | 传 里 叶 描述 子 
原形 la 
旗 转 ja =amen 
altuU) = a(u + A6(u) 

缩放 ja =oamD 
超 点 la =a) ee 














将 描述 形状 的 任务 减少 至 摘 述 一 个 一 维 
图 数 ， 这 界 段 和 特征 的 形状 可 以 用 窍 量 来 
量化 地 描述 
v 矩 量 的 定义 : 
*。 把 边 寞 当 作 下 方 图 函数 : g AT) 


SCr 
下 








表示 与 朱 述 


e 起 量 


~ 窍 量 的 定义 : 





上 
Cr) = 二 (人 r- mngGri) 


1L = 
起 


其 中 也 一 二 
1=| 





表示 与 朱 述 


e 算 量 
~ 谍 量 的 优点 : 
> 实现 是 直接 的 
> 附 市 了 一 种 天 于 边 寞 形状 的 “物理 ” 解 
冬 





> 对 于 谢 转 的 不 敏感 性 
> 为 了 便 大 小 比例 不 敏感 ， 可 以 通过 
伸缩 7 的 范围 来 将 大 小 正则 化 。 








表示 与 描述 


。 概述 

e。 表示 方法 
e 边 弄 拍 述 子 
e。 天 系 描述 子 








表示 与 拍 述 
e。 天 系 插 述 子 


W 


和 


基本 中 息 

阶 柳 关系 编 但 
骨架 天 系 编 但 
方 同 天 系 编 但 
由 角 天 系 编 但 
树 结 构 关 系 编 但 








“ 通过 挖掘 各 个 成 分 乙 间 的 结构 关系 来 描 
述 边 寞 

~ 图 像 中 各 个 部 分 癌 的 结构 关系 是 二 维 
的 ， 而 串 是 一 维 的 ， 期 弄 找 到 一 种 方法 
把 二 维基 系 转 化 为 一 维 的 哩 

~ 主导 电力 是 莉 夺 物体 各 个 部 分 的 连接 线 
段 








表示 与 朱 述 





e | 外 柳 关 系 编 但 
“ 对 于 如 下 阶梯 形 边 界 ， 定 义 两 个 基本 
元 北 a, b 





表示 与 朱 述 


e [外 结 构 天 系 
~ 定义 如 下 产生 规则 : 
(1) ，S$ 一 - aA 表明 起 始 符 S 可 以 被 图 元 a 和 变 元 A 代 替 
(2) A- 一 -bS 表明 变 元 A 可 以 被 b 和 S 代 替 
(3) A- 一 b 变 元 A 可 以 只 被 b 代 
其 中 $、A 是 变量 3 
举例 ; 











表示 规则 序号 一 一 人 3) 本 2 和风 <) 6 国 2 硬 已 昌 四 





表示 与 朱 述 


e。 肯 杂 天 系 编 介 
~ 用 有 回 线 段 来 摘 述 一 个 图 像 的 各 个 部 分 〈 例 如 同 构 区 
域 ) ， 这 个 线段 是 通过 头 尾 连 接 等 方法 得 到 的 。 线 段 
之 间 的 不 同 运 复 代 表 了 区 域 的 不 同 组 合 。 
~ 当 图 像 的 连通 性 可 以 通过 首尾 相 接 或 其 它 连 续 的 方式 
拍 述 的 时 候 ， 最 适 于 使 用 这 种 串 来 描述 。 








表示 与 朱 述 


】 


。 和 肯 杂 天 系 纺 提 3 入 只 
六 


编 僻 Cc+a3 





3a+3a+b+e+e+e+3 








表示 与 拍 述 
。 万 问 关 系 编 但 


v 跟踪 对 象 的 边界 ， 将 跟踪 得 到 的 线段 按 
照 方 同 或 长 度 来 编码 


3a1a8a7a0aSa4a3a2 





表示 与 朱 述 


e 内 角 关 系 编码 
根据 内 角 角 上 度 艺 围 不 同 ， 编 码 为 8 个 人 符 
二 
Us 沽 120s45” 5=00 6 90=135。 
a8:315-360 





直人 | : 





和 3a33a33a33a33a3 323333 





表示 与 描述 

树 结构 中 每 个 结 点 的 意义 和 结 点 之 间 
的 关系 最 为 重要 

举例 : 








AS 产 








数字 图 像 处 理 〈12 ) 


任何 问题 ? 





